Nous venons avec des nouvelles qui pourraient signifier un revirement complet pour l’industrie des processeurs. Nous avons devant nous le principal rival d’ARM et x86, l’architecture RISC-V, cette fois par une équipe d’étudiants universitaires catalans. Comme vous l’avez lu, l’équipe appartenant à l’Universitat Politècnica de Catalunya (UPC) a assemblé le premier supercalculateur RISC-V : Monte Cimone. Pour cela, ils ont été équipés du cluster “Monte Cimone”, avec un excellent équilibre entre consommation d’énergie et performances.
Tout a commencé lorsque l’équipe appartenant à l’Université Polytechnique de Catalogne sous le nom de “NotOnlyFLOPs” s’est démarquée lors d’un concours organisé à Hambourg. C’est ce qu’on appelle le concours de grappes étudiantes 2022, qui s’est déroulé du 30 mai au 1er juin. Dans ce document, l’équipe catalane a assemblé un supercalculateur RISC-V sous le nom de “Monte Cimone”.
Chaque cluster RISC-V est composé de 2 bases SiFive avec SoC Freedom U740
En tant que proposition dans le cadre du concours pour obtenir le meilleur équilibre entre consommation d’énergie et performances, l’Université de Bologne, CINECA et E4 ont contribué à ce cluster. Il a été conçu fin 2021 et est basé sur une plate-forme RISC-V avec six nœuds de calcul et alimenté par le SoC SiFive Freedom U740.
Le SoC Freedom U740, créé en 2020, se compose d’un total de cinq cœurs, quatre pour les applications U7 et un cœur pour le système, le S7. Cela fonctionnerait à 1,4 GHz et dispose de 2 Mo de cache L2, de contrôleurs périphériques et d’Ethernet Gigabit. De plus, comme on peut le voir sur la photo, il est alimenté par deux alimentations Enhance de 250W chacune.
Le cluster est monté dans une taille de rack 25U standard, y compris les nœuds de calcul, les commutateurs et le refroidissement par air. Au total, il y a six serveurs double carte dans un facteur de forme de 4,44 cm (1U) de haut, 42,5 cm de large et 40 cm de profondeur.
Chaque carte mère du supercalculateur RISC-V Monte Cimone est équipée de l’essentiel
Les cartes mères utilisées auront des dimensions Mini-ITX standard, 17 cm x 17 cm, qui abriteront un total de 16 Go de mémoire DDR3 à 1 866 MHz, ainsi qu’un bus PCIe Gen 3 x8. Bien qu’il puisse sembler des générations passées, il sera compatible avec l’interface USB 3.2 Gen 1 et les connecteurs d’extension M.2. En fait, celui-ci est occupé par un SSD NVME de 1 To, le Samsung 970 EVO Plus.
De plus, une carte mémoire microSD est disponible sur chaque carte pour le démarrage UEFI. À l’intérieur du SoC de la carte, deux des six nœuds de calcul sont équipés d’adaptateurs de canal hôte (HCA) InfiniBand. Cependant, l’objectif était de déployer InfiniBand à 56 Go/s pour que RDMA rattrape les performances d’E/S.
Cependant, la fonctionnalité RDMA de HCA n’a pas pu être utilisée, en raison d’une incompatibilité entre la pile logicielle et le pilote du noyau. Pourtant, les tests de ping entre deux cartes et entre une carte et le serveur HPC ont montré une compatibilité totale avec InfiniBand.
“Le framework logiciel HPC s’est avéré plus simple qu’on ne le pensait auparavant. “Nous avons porté tous les services essentiels nécessaires à l’exécution des charges de travail HPC dans un environnement de production, à savoir NFS, LDAP et le planificateur de tâches SLURM, sur Monte Cimone.” tous les packages nécessaires à RISC-V étaient relativement faciles », note l’équipe.
