Nvidia a toujours été connue pour être la société créative des cartes graphiques GeForce pour gaming. Pendant des décennies, ce sont les GPU les plus vendus, le dépassement de DMLA et même dans le secteur professionnel avec les graphiques Quadro ont réalisé des ventes plus élevées que la DMLA. Aujourd'hui, nous pouvons dire que Nvidia se concentre pleinement sur l'IA et le Geforce est passé à l'arrière-plan, mais même avec leur meilleur GPU, il n'a pas pu être à la hauteur du cerveau WSE, qui est devenu la puce la plus rapide du monde au monde.
Qui a le domaine et le leadership dans le secteur de l'intelligence artificielle, c'est qui grandira plus rapidement, du moins comme nous l'avons vu. Un exemple clair de ceci est Nvidia, qui était auparavant deuxième ou troisième en termes d'entreprises avec une plus grande capitalisation, mais dès qu'il a révélé son record de revenus, nous avons récemment revu comment il s'est reproduit en première place, menant au-dessus de tous les autres et dépassant à nouveau Microsoft.
Le cerveau WSE atteint 2 500 jetons par seconde dans le meilleur GPU de Nvidia facilement
Nvidia n'arrête pas de croître et la grande partie de ses revenus provient des centres de données et de l'IA, donc nous imaginons déjà l'importance de leurs graphiques. Ils ont eu tellement de demande que les ordres ont été retardés pendant des semaines et même des mois et bien que l'on pensait que l'intérêt pour l'IA allait être perdu, nous n'arrêtons pas de voir comment cela s'agrandit.
NVIDIA a présenté la nouvelle génération de GPU Blackwell il y a des mois et ceux-ci ont promis d'être plus rapide que la compétition. Il y a une semaine, Nvidia a annoncé qu'elle avait réussi à atteindre 1 000 jetons par seconde dans Flame 4 en utilisant son GPU pour l'IA, mais maintenant ils ont été surmontés et de loin, parce que le cerveau WSE a atteint 2 500 jetons par seconde dans ce même test. Selon Naor Penso, directeur de la sécurité de l'information du cerveau, cette puce est la plus rapide au monde pour l'inférence dans l'IA.
La puce a 44 Go de mémoire à 21 pétaoctets par seconde
L'inférence est le processus de formation nécessaire à une IA pour utiliser les données et apprendre avec ces derniers. Le résultat final serait les modèles de l'IA que nous avons et qui nous permettent de générer du texte, des images, des audio ou des vidéos. Plus le nombre de jetons est grand est le processus lors de la génération de résultats, c'est donc quelque chose de très important pour les entreprises.
Au fur et à mesure que nous progressons avec l'IA, un matériel plus puissant et plus de temps pour obtenir de meilleurs résultats est nécessaire. Les modèles d'IA sont de plus en plus complexes et pour améliorer les précédents, un plus grand effort de temps, d'argent et de matériel sera nécessaire. Pour l'IA, nous avons non seulement besoin de puces très rapides, mais aussi la mémoire est très importante. Nvidia en termes de VRAM et de vitesse est limité, mais dans le cerveau de 44 Go de mémoire plus rapide avec une bande passante de 21 pétaoctets par seconde a été ajouté. Pour avoir une idée, cela implique 880 fois plus de mémoire intégrée qu'une bande passante NVIDIA A100 et 7 000 fois plus élevée que cela.
