in

HGX H20, L20 PCIe et L2

HGX H20, L20 PCIe et L2

Biden ne peut pas arrêter NVIDIA. Jensen Huang combat magistralement toutes les sanctions et tous les blocus que son pays impose à Xi Jinping. Personne ne semble lui faire de l’ombre ici, où, à moins que son entreprise ne soit expressément bloquée, le géant de l’IA continuera à vendre des GPU à la Chine, quelle que soit la couverture matérielle du gouvernement américain. Ce que nous allons voir est un problème aux proportions importantes pour Biden, car loin d’être un problème pour la Chine en raison de la moindre puissance des nouveaux GPU, il s’avère que l’un d’eux est encore plus rapide que le H100 à un moment précis. . Voilà donc à quoi ressembleront les HGX H20, L20 PCIe et L2 PCIe.

Basé sur l’architecture Hopper presque mourante (deux sont Ada Lovelace), la capacité de NVIDIA à répondre aux exigences de Biden n’a mis que quelques semaines à apparaître sous la forme de trois nouveaux produits qui, sans être ce que la Chine entend, vont changer le jeu encore une fois.

NVIDIA HGX H20, un problème pour Biden

Ce ne sera pas un problème, ce sera un problème direct. Pour le comprendre, nous devons commenter les spécifications qui ont été divulguées. Avec ce HGX H20 nous aurons un GPU qui aura pas moins de 96 Go avec HBM3, une bande passante de 4 To/s avec des performances assez faibles imposées par le script que Biden définit :

  • INT8 et FP8 via 296 TFLOPS Tensor Core
  • BF16 et FP16 avec 148 TFLOPS Tensor Core
  • TF32 avec Tensor Core de 74 TFLOPS
  • FP32 avec 44 TFLOPS
  • FP64 avec seul 1 TFLOP

Il sera accompagné de 60 Mo de L2, ce qui est assez bref, même si la consommation passera à 400 W, et étonnamment, chose que nous ne comprenons toujours pas, NVIDIA a inclus NVLink sans plafonnement, c’est-à-dire qu’il ira à 900 Go/ s, alors qu’en théorie cela ne serait pas possible en raison des restrictions. Pour en revenir au début, où est la polémique avec ce GPU ? Eh bien, ce NVIDIA HGX H20 possède certaines nouveautés provenant de la prochaine puce haut de gamme des verts, la B100, et par conséquent, sa bande passante est de 4 Tbps, soit 17,64% supérieure à celle de l’actuel H100.

A lire également  le ventilateur 6000 RPM créé pour l'industrie minière

Qu’est-ce que cela influence ? Eh bien, les performances de LLM Inference sont supérieures, pas inférieures, à la meilleure puce verte de cette génération, et par conséquent, la Chine et NVIDIA viennent de brillamment déjouer Biden, au moins en partie.

NVIDIA L20 PCIe

NVIDIA-GPU-IA-Spécifications-H100-SXM,-H100-PCIe-et-H100-NVL

Ici, nous entrons déjà dans l’architecture Ada LoveLace, et nous avons donc des caractéristiques différentes provenant de la puce RTX 4090, l’AD102. Il disposera de 48 Go de GDDR6 avec une bande passante de 864 Go/s, 239 TFLOPS sur INT8 et FP8 et 119,5 TFLOPS sur BF16 et FP16.

A noter qu’étant une version raccourcie du L40, il inclura également des RT Cores et pas moins de 96 Mo de L2, bien qu’il soit livré avec les Media Engines NVENC et NVDEC. Cela dit, sa consommation ne sera que de 275W et ce sera du PCIe Gen 4.

NVIDIA L2 PCIe

Tableau comparatif des nouveaux GPU NVIDIA pour la Chine pour l'IA

Elle sera la plus jeune des trois sœurs, et partage avec la L20 une philosophie que l’on vient de voir. Il aura cependant des performances moindres, à commencer par ses 24 Go de VRAM GDDR6 avec 300 Go/s de bande passante pour ladite mémoire.

Les performances sont tout à fait acceptables, avec 193 TFLOPS, 96,5 TFLOPS et 48,3 TFLOPS sur INT8/FP8, BF16/FP16 et TF32. Il aura un nombre inférieur de RT Cores, 36 Mo de L2 et moins de NVENC et NVDEC. Curieusement, sa consommation n’a pas été révélée.

Cela dit, les HGX H20 et L20 PCIe arriveront entre la fin du mois et le début décembre, ce qui montre que NVIDIA était bien en avance sur les sanctions que les Etats-Unis allaient imposer à la Chine. Le L2 PCIe, en revanche, sera reporté à fin décembre ou début 2024. Evidemment, les prix n’ont pas encore été dévoilés.

A lire également  le premier avec un écran 18" 4K à 200 Hz

Juste une information de plus, très importante dans la guerre technologique entre la Chine et les États-Unis qui a NVIDIA au milieu : seul le HGX H20 utilisera CoWoS, tandis que les L20 PCIe et L2 PCIe utilisent un interposeur commun. Cela signifie que le goulot d’étranglement de TSMC avec CoWoS n’affectera que le premier, mais pas les deux seconds, qui pourraient arriver en grand volume pour les entreprises qui ont besoin de former des LLM moins importants.

En d’autres termes, la décision de NVIDIA est une très bonne décision. La Chine perd de la puissance de calcul mondiale, mais gagnera en inférence LLM, étant capable d’obtenir des GPU à un niveau d’unités tout aussi important, ce qui montre que les États-Unis ont l’intention d’écraser, mais pas d’étouffer, la Chine en tant que telle, puisqu’elle a besoin de vendre du matériel. et ils savent.