in

“Les GPU PC sont la clé du succès de l’IA”

"Les GPU PC sont la clé du succès de l'IA"

Compte tenu de ses antécédents et de son curriculum vitae, Raja Koduri a gagné le respect du monde des semi-conducteurs. Que ce soit avec plus ou moins de succès dans le matériel qu’il a conçu et dans les groupes d’ingénieurs qu’il a dirigés, on ne peut nier qu’il est une voix faisant autorité dans le secteur des GPU. Par conséquent, ses déclarations sont généralement assez juteuses et généralement bien orientées, et il a maintenant quelque chose de clé à dire à un moment très critique du marché et où il semble que peu de gens y prêtent attention : “Les GPU pour PC sont essentiels dans l’IA”.

Ben oui, pour Koduri l’approche adoptée par les grandes entreprises est, à certains égards, faux. Un utilisateur a posé une question à l’ingénieur de X et les conséquences basées sur les conclusions ont conduit à des réflexions vraiment intéressantes qui devraient être arrêtées et analysées.

HBM comme mémoire généralisée dans PC et serveur ?

La question était la suivante, étant donné ce qui suppose une poussée sans précédent dans le monde de la mémoire, principal goulot d’étranglement de tout GPU ou accélérateur aujourd’hui, que ce soit pour gaming, pour l’IA ou pour le HPC. La réponse de Koduri a été immédiate, et comme c’était évident…

La réponse est non. Malheureusement, le prix par octet sur HBM a augmenté et tout indique que HBM4 coûterait encore plus cher par octet. Les prix HBM suivent la loi de Moore à l’envers !! En 2015, notre rêve était de faire de HBM un dispositif de mémoire grand public, y compris dans les ordinateurs portables.

Deux modèles de mobiles ont également été expédiés, l’un d’eux (KBL-G) était un partenariat entre AMD et Intel, l’autre était largement limité au MacBook Pro d’Apple.

L’ingénieur a donc essayé d’utiliser le HBM comme mémoire principale pour le CPU et le GPU, mais cela n’a finalement été optimal que dans les centres de données, comme il le dit, pour le prix pur. Cela amène Intel, AMD et NVIDIA à être largement confrontés à des problèmes d’approvisionnement dans des secteurs tels que l’IA, où le package qui les héberge constitue la principale pierre d’achoppement et, de ce fait, Davi Airlie, ingénieur GPU Red Hata publié une déclaration au Raja pour exprimer son opinion sur cette question.

A lire également  Jusqu'à 7% plus rapide que l'i9-12900K

Intel, AMD et NVIDIA ont-ils partiellement erroné leur approche des GPU et de l’IA ?

AMD-NVIDIA-Intel-ventes-eBay-Chine

Airlie a commenté ce qui suit :

“Je pense qu’AMD a commis une erreur avec son approche incohérente entre les cartes grand public et celles des centres de données, les différents ensembles de fonctionnalités limitent les développeurs à l’utilisation de cartes plus difficiles à obtenir. La production du MI300 avec des développeurs utilisant 7900” XTX rendrait AMD beaucoup plus pratique. “.

Et il a raison, mais seulement dans la partie fourniture, car, même si le RX 7900 s’additionne. Raja a soutenu ce qui suit, ce qui est très intéressant :

Oui, les développeurs de GPU pour PC sont les principaux acteurs du succès des GPU dans les centres de données. Par conséquent, tous les outils de développement doivent fonctionner parfaitement sur les GPU PC. Actuellement, cela est largement vrai avec NVIDIA Geforce. Les Radeon se sont nettement améliorées au cours des 6 derniers mois et font preuve d’un plus grand engagement envers les développeurs de PC.

L’Arc A770 16 Go est également tout à fait raisonnable, mais l’engagement d’Intel n’est pas clair. Je reçois encore des regards sales de la part de mes ingénieurs lorsque je leur demande de changer leur carte Geforce. Les ingénieurs coûtent beaucoup plus cher que n’importe quel delta de prix de GPU, donc leur productivité ne vaut pas la peine d’être manipulée.

Les GPU de jeu sont très abordables dans le monde entier. Juste pour donner un exemple, les ingénieurs des petites villes de pays comme l’Inde qui n’ont pas accès aux GPU DC peuvent se rendre chez leur revendeur de PC local, acheter une carte Geforce et commencer à coder. Une architecture et une pile de pilotes cohérentes sur les GPU PC et DC constitueront un énorme avantage. Il s’agit d’un inconvénient largement négligé dans l’écosystème dédié aux accélérateurs d’IA. Et secrètement, la plupart des enfants IA veulent aussi jouer.

Bulle 2.0 dans le secteur GPU gaming?

Rendu de jeu multi-GPU Intel Arc A770 SIGGRAPH

Après cette réflexion viennent les craintes, car pourrions-nous connaître une autre bulle comme celle des cryptomonnaies alors que tout le monde s’en prend à l’IA ? Les nouvelles générations de cartes graphiques sont susceptibles d’avoir la même quantité de VRAM, voire un peu plus dans certaines gammes, ce qui rend la série attractive. gaming de chaque fabricant aux utilisateurs.

A lire également  Sony met à jour les lunettes PSVR2 pour qu'elles fonctionnent sur PC, mais...

Par conséquent, il n’est pas exclu que beaucoup souhaitent approfondir les capacités de l’IA via des GPU pour PC, comme cela se produit déjà, et cela pourrait certainement faire monter en flèche les prix, en particulier pour les modèles bas de gamme avec une plus grande VRAM.