L’essor de l’IA a poussé la Chine à ne pas se reposer sur les entreprises américaines pour développer ses propres GPU. La dernière à rejoindre les rangs est Metax, qui vient de présenter sa première carte graphique dotée d’un GPU optimisé pour l’IA générative. Quelles sont les spécifications et les caractéristiques de cette carte ? Jetons un coup d’œil sur
Jusqu’à récemment, les cartes graphiques dans les serveurs n’étaient utilisées que dans les institutions scientifiques et les grandes fermes de rendu pour les films avec des graphiques générés par ordinateur. Cependant, depuis quelque temps, deux tâches justifient leur existence : l’IA générative et le transcodage vidéo, et il est évident que la Chine ne veut pas rester à la traîne.
Metax MXN100, une carte graphique d’IA générative basée sur le cloud et fabriquée en Chine
La carte graphique Metax MXN100 n’est pas destinée au marché des PC domestiques, mais aux centres de données à la recherche d’un GPU compact et peu gourmand en énergie. Ce matériel a la particularité d’être très peu encombrant, puisqu’il occupe un seul emplacement et utilise un refroidissement entièrement passif. Bien que non divulgués officiellement par le constructeur, ces deux points indiquent qu’il s’agit d’un GPU bas de gamme à faible consommation d’énergie. Quant à sa mémoire vidéo, elle est de type HBM2E, mais nous ne connaissons pas la taille du bus pour le moment, du moins pas officiellement.
Cependant, nous avons pu trouver un trailer promotionnel du MXN100 sans son emballage et nous avons pu voir qu’il utilise une seule pile de mémoire HBM2E, ce qui en termes de bande passante équivaut à un bus GDDR6 de 128 bits. Si nous regardons ses spécifications, sa capacité est de 80 TFLOPS en FP16 et 160 TOPS en Int8, un chiffre qui peut sembler très élevé si nous pensons qu’ils proviennent d’unités SIMD, cependant, il s’agit de la performance d’unités pour l’IA et nous devons mettre les choses dans leur contexte réel.
Si nous faisons une comparaison avec la RTX de NVIDIA, nous constatons que la RTX 3060 a une puissance de 102 TFLOPS en FP16 à partir de ses Tensor Cores, de sorte que la proposition de Metax en puissance brute serait un peu inférieure, mais supérieure aux 52 TFLOPS Tensor de la RTX 2060.
Ses performances sont-elles décevantes ?

Il est à noter que cette carte graphique n’est pas destinée à être vendue au public, mais à être utilisée dans des serveurs où la performance par watt est importante et qui seront en fonctionnement permanent. Sa faible consommation d’énergie est donc très intéressante, même si sa puissance brute est inférieure à d’autres solutions sur le marché. Mais n’oublions pas que chaque MHz supplémentaire au-delà d’un certain point coûte de plus en plus cher.
Cela est dû au fait que nous avons déjà vu de nombreuses tentatives de la Chine pour prendre pied sur le marché des cartes graphiques, avec des tentatives qui se sont souvent révélées très médiocres. Mais ce n’est pas le cas ici. Nous ne connaissons pas le TDP de la Metax MXN100, mais nous ne nous attendons pas à ce qu’il soit supérieur aux 75W que le port PCI Express fournit à lui seul sans connecteurs externes. Bien qu’elle n’ait pas la puissance de la RTX 40, nous ne doutons pas que ses performances par watt soient compétitives.
Dans le domaine de l’informatique et de l’intelligence artificielle, avoir plusieurs cartes graphiques fonctionnant en parallèle tant que le budget énergétique est respecté n’est pas une mauvaise option. L’important est de savoir si les performances obtenues sont bien meilleures dans certaines conditions de refroidissement et d’alimentation qu’avec une puissante carte NVIDIA RTX.
