NVIDIA a annoncé lors des GTC sa nouvelle puce graphique haut de gamme destinée à l’Intelligence Artificielle, on parle de Blackwell. Il ne s’agit pas seulement de la plus grande puce graphique au monde, mais elle parvient à augmenter de cinq fois les performances de ce qui était jusqu’à présent le GPU le plus puissant au monde, Hopper (NVIDIA H100).
Le GPU NVIDIA Blackwell est également la première puce graphique multi-chip design (MCM) créée par NVIDIA. Et fondamentalement, chaque puce Blackwell est constituée de deux GPU Blackwell reliés entre eux. Désormais, la plate-forme utilisée pour lui donner vie combine deux puces Blackwell complètes et un processeur Arm Grace. Examinons de plus près ce que NVIDIA Blackwell propose à l’industrie.
NVIDIA Blackwell augmente de 5 les performances de la meilleure puce IA actuellement disponible
Le GPU NVIDIA Blackwell est composé de 208 milliards de transistors. Ce sont 128 milliards de plus par rapport à la puce NVIDIA Hopper. Cette puce intègre également quatre fois plus de mémoire intégrée dans la puce elle-même, ce qui se traduit par une offre allant jusqu’à 192 Go de mémoire HBM3e qui, associée à une interface de 8 192 bits, fournit une bande passante de 8 To/s.
Cette puce est fabriquée par TSMC à l’aide de sa lithographie 4nm 4NP, tandis que chaque GPU qui compose la puce Blackwell est interconnecté via une interface d’une bande passante de 10 To/s. NVIDIA Blackwell est composé d’un total de 20 480 cœurs CUDA, utilise des puces mémoire HBM3e à 8 couches et est capable d’atteindre un TDP allant jusqu’à 700 W. Ce TDP est le même que celui trouvé dans les GPU NVIDIA H100 et H200.
NVIDIA Blackwell est capable de fournir des performances d’IA de 20 pétaFLOPS, ce qui se traduit par une vitesse 5 fois plus rapide que la puce NVIDIA H100. La puce Hopper haut de gamme destinée aux charges de travail liées à l’IA. Comme nous l’avons dit, deux de ces puces complètes sont accompagnées d’un processeur Grace pour créer la superpuce NVIDIA HB200.
Cette superpuce dispose d’un processeur avec 72 cœurs Arm Neoverse V2 ainsi que de deux GPU Blackwell, d’un accès à 384 Go de mémoire HBM3e et d’une interconnexion NVLink-C2C avec une bande passante de 900 Go/s.
Performances de la puce NVIDIA Blackwell par rapport à NVIDIA Hopper :
- 20 PFLOPS FP8 (2,5 fois plus rapide que Hopper)
- 20 PFLOPS FP6 (2,5 fois plus rapide que Hopper)
- 40 PFLOPS FP4 (5,0x plus rapide que Hopper)
- Paramètres 740B (6,0 fois plus rapide que Hopper)
- Paramètres 34T/s (5,0 fois plus rapide que Hopper)
- NVLINK 7,2 To/s (4,0 fois plus rapide que Hopper)
Nous parlons de la puce graphique la plus puissante au monde
Grâce à ces améliorations, NVIDIA est convaincu que Blackwell est la puce IA la plus puissante au monde. Cette architecture utilise le Transformer Engine de 2e génération. Ceux-ci intègrent une nouvelle prise en charge de la mise à l’échelle des microtenseurs et les algorithmes avancés de gestion de la plage dynamique de NVIDIA intégrés aux frameworks NVIDIA TensorRT™-LLM et NeMo Megatron.
Cela signifie que Blackwell prendra en charge le double des tailles de calcul et de modèle avec de nouvelles capacités d’inférence d’IA à virgule flottante 4 bits. Avec la 5ème génération de l’interconnexion NVIDIA NVLink, une performance bidirectionnelle de 1,8 To/s par GPU est obtenue. Cela garantit une communication transparente à haut débit entre jusqu’à 576 GPU pour les LLM les plus complexes.
Les GPU NVIDIA Blackwell disposent d’une maintenance préventive IA. Cela garantit la fiabilité, la disponibilité et la facilité de maintenance. Cette IA exécute des diagnostics et vous aide à prédire les problèmes de fiabilité. Cela maximise la disponibilité du système et améliore la résilience afin que les déploiements d’IA à grande échelle se déroulent sans interruption pendant des semaines, voire des mois. Cela se traduit par une réduction des coûts d’exploitation.
Le GB200 est un composant clé du NVIDIA GB200 NVL72, un système multi-nœuds à l’échelle rack refroidi par liquide pour les charges de travail les plus exigeantes. Il combine 36 superpuces Grace Blackwell, dont 72 GPU Blackwell et 36 CPU Grace interconnectés via NVLink de 5e génération.
De plus, le GB200 NVL72 comprend des unités de traitement de données NVIDIA BlueField-3 pour permettre l’accélération du réseau cloud, le stockage composable, la sécurité zéro confiance et l’élasticité de calcul GPU dans les cloud IA hyperscale. Le GB200 NVL72 offre des performances jusqu’à 30 fois supérieures à celles du même nombre de GPU NVIDIA H100 Tensor Core pour les charges de travail d’inférence LLM et réduit les coûts et la consommation d’énergie jusqu’à 25 fois.