Les retards auxquels NVIDIA a été confronté avec Blackwell en raison de problèmes avec TSMC et les skins pour la fabrication des GPU, où ils les ont ensuite eu avec les conceptions HBM3e de Samsung, ont entraîné quelques mois supplémentaires pour son lancement et sa mise en scène. En principe, NVIDIA a déclaré qu'il y aurait trois options, trois modèles GB200 à acheter pour fonctionner avec l'IA et le HPC, mais malheureusement une fuite très détaillée indique que l'option double rack sera annulée. Autrement dit, le NVIDIA GB200 NVL36x2 appartient à l'histoire ancienne, il est annulé et les raisons sont curieuses.
Les choses ne vont pas bien pour NVIDIA, c'est sûr, et au contraire, ça se vend comme des petits pains. Les prévisions concernant son GPU le plus rapide pour l'IA ont changé et l'industrie doit désormais s'adapter. Une fois de plus, Ming-Chi Kuo donne des informations privilégiées selon lesquelles les verts n'auront qu'une seule option de rack à vendre.
NVIDIA annule son GB200 NVL36x2 car l'approche à trois bandes est trop difficile
Et cela n’a peut-être pas vraiment à voir avec l’entreprise, mais avec les options de fabrication, d’espace, de TDP et de performances. Les trois projets initiaux appelés GB200 NVL36, GB200 NVL72 et GB200 NVL36x2 ont été développés simultanément, mais ce dernier est annulé en raison d'un DevDrop débutant le mois prochain.
Ce qui se passe? Eh bien, c'est facile à comprendre. NVIDIA souhaitait maximiser la production du NVL36 et l'utiliser pour construire des racks doubles, sachant que le NVL72 est non seulement plus cher, mais aussi plus compliqué à fabriquer pour TSMC. L'objectif était donc de proposer cette solution à deux racks pour NVL36x2 avec une puissance similaire et une consommation légèrement supérieure.
Le problème est que la réalité a pris le dessus et que les clients ne voient pas d'avantages au NVL36x2 par rapport au NVL72, mais plutôt des inconvénients. En fait, Microsoft a déjà informé NVIDIA qu'il opterait par exemple exclusivement pour le NVL72.
Plus d'espace, plus de consommation, moins de performances
Ce sont les trois raisons pour lesquelles NVIDIA a décidé d'annuler son GB200 NVL36x2. Les ressources de l'entreprise, même si elles sont gigantesques, sont limitées, et si les clients ne veulent pas de ce GPU double rack, alors cela ne sert à rien de continuer, et c'est logique.
Le NVL72 permet d'économiser de l'espace dans les centres de données en n'étant qu'un seul rack, est confronté à moins de problèmes de refroidissement et augmente l'efficacité de l'espace au sein du complexe où il est installé. De plus, selon Kuo, NVL72 a démontré en interne une meilleure efficacité d'inférence grâce à la conception logicielle parallélisable. Cependant, en formation pour LLM, les GB200 NVL72 et GB200 NVL36x2 sont très équilibrés, ce qui n'implique pas que NVIDIA annule ce dernier pour consommer quelque chose de plus : 66 kW pour chaque rack contre les 120 kW du NVL72.
De même, et pour finir, il y a une autre mauvaise nouvelle. Kuo dit que NVIDIA s'est montré très optimiste en affirmant que le GB200 NVL72 arriverait au premier semestre de l'année prochaine. Le leaker et analyste affirme qu'il est plus probable qu'il soit retardé vers le second semestre de la même année. Il s’agit d’un très gros revers, car l’architecture de Vera Rubin devrait être retardée de près d’un an et aller directement à 2026, alors qu’elle serait présentée en 2025.
Il sera étrange pour les clients de recevoir leur matériel alors qu'une nouvelle architecture est sur le point d'être présentée, en théorie beaucoup plus rapide que Blackwell comme nous l'avons vu dans les premières fuites, mais c'est NVIDIA, c'est le secteur de l'IA.