Rubin Ultra, Feynman, Vera, Station DGX Spark Y

Ce que Nvidia a mis sur le plateau de jeu hier après-midi a été difficile à digérer pour tous ses rivaux sur le marché, au point qu'il a vraiment déclenché la folie avec son matériel pour IA. Et cela aurait pu être pire pour Intel et AMD, car il a non seulement montré ce qu'il lancera en 2026 et 2027, mais a clairement indiqué ce qui, pour l'instant, ne peut pas créer par des limites de différents types, mais cela arrivera à l'avenir. Pendant ce temps, ce GTC 2025 montre la base de ce qui sera le matériel de Nvidia pour les deux prochaines années, avec Blackwell Ultra, Vera Rubin, Rubin Ultra, Feynman, DGX Spark et DGX Station.

C'est un changement de rythme si brutal qu'il ne semble vraiment pas réel. Ce qui a été présenté par les Verts, avec Huang à nouveau comme le protagoniste vêtu de son cuir, est un saut en démence aux affirmations de ses rivaux, au point qu'Intel pourrait penser directement à quitter le marché.

Nvidia GTC 2025, le plus grand événement de la société a commencé fort: Blackwell Ultra NVL72 pour la seconde moitié de ce 2025, jusqu'à 20 To de HBM3E

Chaque GPU de ce système obtiendra 288 Go de HBM3E, tandis que les systèmes complets, déjà filtrés précédemment, seront appelés NVL72, donc en effet, NVIDIA laisse derrière elle les options de nombre inférieur d'unités. Nous ne nous arrêterons pas aussi ici au-delà de commenter les données, car nous savons tout avant la présentation.

Il aura une performance d'inférence vraiment brutale avec FP4 et dans FP8, qui, selon NVIDIA, augmentera les performances en 1,5x par rapport au GB200 NVL72 avec ce nouveau système GB300, ou ce qui est le même, est 50% plus rapide en ces termes. Les Verts affirment qu'il y aura de nouvelles instructions pour atteindre ces performances générales où avec elles vous pourriez doubler ce qui est vu avec le GB 200.

En cas de peu, il aura jusqu'à 20 To de HBM3E au total et jusqu'à 40 To de mémoire générale, et aura également une bande passante de 14,4 To / s pour son ConnectX-8 Supernic, la carte Green High Performance Network. Enfin, n'oubliez pas que Blackwell Ultra a une taille de grille de 2 gpu, c'est-à-dire que Nvidia a atteint la taille maximale autorisée par les réticules de photolithographie d'ASML dans les scanners.

Pour comprendre cela, il se définira plus tard à mesure que nous avançons dans les nouveautés de ce GTC 2025, la taille du réticule SO-called n'est rien de plus que la zone maximale qui peut être enregistrée et imprimer en une seule exposition à travers le photomáscara. Dans le cas du GB300 Blackwell Ultra, donne deux unités interconnectées.

Nvidia Vera Rubin et Rubin Ultra: NVL144 et NVL576 avec CPU Vera, directement un autre niveau

Un changement perturbateur, encore une fois, de rythme et d'accélération pour laisser leurs rivaux derrière. Pour la seconde moitié de 2026 et la seconde moitié de 2027, deux modèles de systèmes doivent être différenciés: Vera Rubin et Rubin Ultra.

Vera Rubin arrive cataloguée avec le nom de NVL144 et sera vraiment un moyen, car les verts garantissent jusqu'à 3,6 exaflops en FP4 pour l'inférence, 1,2 exaflops pour une formation basée sur FP8 et une performance générale de + 330% par rapport à ce que nous venons de voir avec les systèmes GB300 NVL72. Il est vrai qu'il a deux fois le GPU à son actif et que les conditions de cette métrique, mais elle est toujours impressionnante.

De plus, NVIDIA déclare qu'il incorporera HBM4 (modules récemment envoyés par SK Hynix dans les tests en ce moment) avec jusqu'à 13 To / s, où chaque GPU Vera Rubin aura 288 Go de cette mémoire. En cas de peu, il s'accompagnera de jusqu'à 75 To de DRAM, ce qu'il représente dans son ensemble et selon Huang une amélioration de 60% dans cette section clé.

Il n'y a rien là-bas, car ils présentent NVlink6 avec jusqu'à 260 To / s, atteignant un + 200% la bande passante de la version actuelle de Blackwell Ultra, et pour terminer, si ce n'était plus fou, Vera Rubin NVL144 aura CX9, c'est-à-dire ConnectX-9 Supernic, avec une autre bande passante de 200% jusqu'à 28.8 TB / s. Sans aucun doute, Nvidia joue un autre jeu aujourd'hui, et le pire, c'est que cela commence.

A lire également spécifications et prix de lancement

En 2027, Rubin Ultra NVL576 arrivera pour détruire tout espoir du reste des concurrents

Démoralisant, aussi peu, pour ses rivaux, que Nvidia a montré hier. “Il n'y a pas de mot dans Elphical, ni dans l'Entre, ni le Mordor, ni l'homme, qui ne peuvent décrire l'horreur” qui devait être de voir la présentation du GTC 2025 comme un éventuel concurrent du vert.

Et c'est que la carte s'est renversée avec Rubin Ultra NVL576, ou ce qui est le même, 576 GPU dans le même système. Il arrivera pour la seconde moitié de 2027 et la performance est Hollywood Film, comme peu: jusqu'à 15 exaflops en FP4 et inférence, 5 Exaflops en formation basée sur FP8.

Selon NVIDIA, cela équivaut à multiplier par 14 la performance observée aujourd'hui du GB300 NVL72 pour la seconde moitié de cette année, ou ce qui est le même, presque un + 1 400% en FP4 et FP8 pour l'inférence et la formation, fous. Il est vrai que Nvidia compare 72 GPU à 576, c'est-à-dire 8 fois moins, mais le chiffre est toujours étourdi, bien qu'il puisse avoir des nuances.

Terminant avec cette section, nous devons parler de mémoire. SK Hynix aura en seulement deux ans la version HBM4E la plus avancée sur la planète, et cela suppose, selon les données vertes, 4,6 Pb / s pour Rubin Ultra NVL576, et enfin, il aura une augmentation de DRAM jusqu'à 365 To par unité, une augmentation d'un ensemble de + 800%, encore une fois, vous devez cligner plusieurs fois pour lire la figure.

Nous fermons ce bloc avec la connectivité: nvlink7 avec 1,5 pb / sy Cx9 avec jusqu'à 115,2 To / s, augmentation de + 1 200% et + 800% respectivement. Nous n'oublions pas le processeur Vera, qui reste inchangé avec ses 88 bras, 176 fils et 1,8 To / s avec Nvlink-C2C, mais vous devez mettre l'accent sur un autre détail ci-dessus. Et c'est que Rubin Ultra amènera le réticule à un nouveau niveau avec 4 fois la taille d'une grille se joignant à un seul emballage de 4 GPU avec 16 batteries HBM4E, ou ce qui est le même, 100 pf inférence pour FP4 et 1 To de HBM4E pour chaque unité.

Pour le comprendre plus facilement, Nvidia et TSMC ont des problèmes d'escalade dans les transistors, donc ce qu'ils font, c'est dupliquer la zone pour chaque silicium dans chaque génération, ce qui implique une pression énorme pour les scanners et les photomáscaras d'ASML, qui sont déjà chers, ils doivent maintenant sortir de l'échelle. C'est pour amener la technologie et la technique à un taux de 1 an pour doubler ce qui est fait dans le précédent, il ne s'agit pas seulement de marcher sur l'accélérateur, c'est pour le faire passer jusqu'à ce que l'asphalte touche comme s'ils étaient le “Picapiedra”, c'est un autre niveau.

Nvidia Feynman, l'architecture d'ici 2028 qui peut mettre fin aux options d'AMD, Google, Amazon

Si tout le monde est plongé dans l'accélération pour attraper Nvidia, même en créant leurs propres puces pour les adapter à leurs besoins et ne pas dépendre des verts, le rythme de Huang et le leur pourrait finir par dynamiser les investissements actuels d'AMD, Google, Amazon et bien d'autres. Ce qui suit dans la feuille de route de Nvidia n'est rien de plus qu'une nouvelle architecture, Feynman, d'ici 2028, qui arrivera avec HBM5, même CPU Vera, CX10 et Nvlink8 comme principales améliorations.

Quelle sera vraiment les nouvelles? C'est la grande question, mais comme Nvidia est un fan du choix des noms de ses architectures basés sur le travail de grands mathématiciens et physiques, connaissant la trajectoire du personnage, nous pouvons faire certaines cabales sur leur place.

Comme nous pouvons le voir en ligne, Nvidia Feynman rendra hommage à Richard Phillips Feynman, un physicien théorique américain qui a eu d'excellents travaux, tels que la formulation des trajectoires intégrales de la mécanique quantique, la théorie de l'électrodynamique quantique, la physique des particules avec des particules superfluentes et certains théories des physiciens avec des particules.

Nvidia sera-t-elle introduite dans la mécanique quantique avec son GPU AI? Est quantum l'avenir de ce secteur et gaming? C'est possible, et il y a quelque chose que nous savons à ce sujet. Certains brevets il y a 3 et 4 ans que nous avons vus se sont reflétés dans le GTC 2025 hier, et cela signifie que ce que nous verrons en 2028 est vraiment né ou est très dirigé, ce n'est pas de la “fumée pure”.

A lire également L'Apple M5 atteint 103º C sur un MacBook Pro

En fait, NVIDIA est déjà dans le secteur, par exemple, avec Cuquantum (présenté en 2021 comme SDK et mis à jour l'année dernière), CUDA Quantum (plate-forme pour QPU, émulation quantique dans GPU et CPU, renommée l'année dernière à Cuda-Q) et DGX Qualtum (présentée en 2023 étant un système hybride entre le quantium et le calcul classique).

NVIDIA DGX Spark et DGX Station: à partir des serveurs de bureau avec Grace Blackwell

Nvidia a présenté les superordinateurs personnels de IA DGX Spark et de la station DGX, basée sur la plate-forme Grace Blackwell. Ces systèmes portent la puissance de l'architecture Grace Blackwell aux ordinateurs de bureau, permettant aux développeurs, aux chercheurs et aux scientifiques des données d'exécuter des modèles localement ou dans le cloud.

DGX Spark est le supercalculateur IA le plus compact, équipé du GB10 Superchip, qui comprend un GPU Blackwell avec des centres de cinquième génération et de soutien pour FP4, atteignant jusqu'à 1000 milliards d'opérations par seconde. De plus, il intègre NVLink-C2C, offrant une bande passante 5 fois plus élevée que PCIE 5.0, optimisant le transfert de données entre le CPU et le GPU.

La station DGX est conçue pour les charges de travail AI à grande échelle et comprend la GB300 Grace Blackwell Ultra Superchip, avec 784 Go de mémoire cohérente et une connectivité haute performance via NVIDIA ConnectX-8 Supernic (jusqu'à 800 Go / s). Cela vous permet de connecter plusieurs stations pour accélérer l'inférence et la formation.

Les deux systèmes sont intégrés à la plate-forme NVIDIA complète, facilitant la migration des modèles entre les centres de bureau, le cloud et les centres de données sans modifications de code. DGX Spark est désormais disponible pour les réservations, tandis que la station DGX arrivera à la fin de l'année par le biais de fabricants tels que ASUS, Dell, HP et Supermicro.

L'avenir est encore plus impressionnant: le silicium fotonique

Seulement un peu de ce qui pourrait être, et pour le moment il ne l'est pas, en termes de fabrication de GPU dans les plaquettes. Et oui, Nvidia a dit ouvertement que l'intention avec Grace Blackwell NVL72 était de créer un GPU massif de la taille d'une tranche de 300 mm, mais en raison de la faille “de ce qui a été commenté avec les limites de la taille du réticule, de la consommation et de l'impossibilité d'avoir un système de refroidissement pour extraire les watts du Monster, ils n'ont pas pu en fabriquer.

Le système est similaire à celle du cerveau, seulement infiniment plus complexe. C'est l'avenir de l'entreprise en GPU ou QPU pour l'IA, nous verrons si avec Feynman peut être effectué, en particulier avec les scanners High-Na EUV d'ASML et de nouveaux photomáscaras. Pendant ce temps, vous devez parler de Nvidia Photonics pour le secteur photonique du silicium, qui est sans aucun doute l'avenir avec le QPU.

Nvidia affirme que son silicium obtient un CPO 1,6t dans une puce, c'est-à-dire qu'il est le premier avec 1,6 térabits avec optique co-emballée et intègre également de nouveaux modulateurs MRM microoptiques (modulateurs de micro-anneaux). Il a également l'honneur d'être le premier moteur photonique empilé 3D grâce à la technologie de l'emballage TSMC, où des lasers à haute puissance et à efficacité ont été utilisés pour améliorer la transmission des données.

Il y aura deux produits dans la gamme Nvidia Photony pour ce GTC 2025:

Spectrum-X avec photonique en silicium intégré → Deuxième moitié de 2025.
Quantum-X avec Photonie en silicium intégré → Deuxième moitié de 2026.

Par conséquent, ils seront une réalité palpable sous peu et sûrement, avec Feynman, voyons une union entre la NVL et ces photoniques d'une manière ou d'une autre que nous ne savons toujours pas. Et jusqu'à présent, le GTC 2025, qui a laissé d'autres perles, comme dans le secteur automobile, le cloud et d'autres détails annexés, mais en termes de matériel, au cas où il n'aurait pas été clair, il a été une vraie folie qui met en échec la grande majorité des concurrents, et directement d'autres les laissent hors du marché, au moins si les données qu'ils ont présentées sont vraies.