in

Modulaire, flux de données, compression et décompression, flexible

AMD-RDNA-4-arquitectura-flexible-modular-Data-Flow-motor-de-compresión-y-descompresión

AMD fait de grands efforts avec une architecture qui semblait un petit pas en avant d'une avance claire pour rivaliser avec Nvidia. À l'occasion de la Hot Chip 2025, les Reds ont montré plusieurs clés de leur nouvelle architecture de l'ADNr 4, et parmi lesquelles la flexibilité pour créer différents modèles à partir du même GPU, un système de compression et de décompression centralisé qui éclaircit le trafic de données, une conception modulaire et flexible avec une plus grande sécurité et une résilience, et un débit optimisée déjà hors de la fabrication.

Tout cela, ensemble, cherche que cette génération de graphiques RX 9000 abandonne non seulement, mais le faites plus efficacement, évolutif et préparé pour des charges de travail de plus en plus complexes. Voyons comment cela fonctionne en fonction de ce que AMD a montré.

AMD RDNA 4, l'architecture la plus modulaire, avec un meilleur moteur de flux de données, de compression et de décompression qui le rend totalement flexible

Pour mieux comprendre où AMD souligne avec ces nouveautés, vous devez voir comment ils ont repensé la structure interne de l'architecture pour chaque GPU et SOC, ce que cette nouvelle approche est traduite et quel rôle il joue dans l'évolution des technologies telles que le tracé des rayons, le traçage de chemin ou la gestion des géométries denses (DGF), des sections précédentes, des sections où il y a également eu des progrès de la broux qui a été directement lié dans les mois.

L'un des changements les plus frappants est la configuration flexible du silicium, c'est-à-dire de chaque GPU.

AMD-RDNA-4-Configuration-flexible du SOCAMD-RDNA-4-Configuration-flexible du SOC

Maintenant, chacun peut être adapté à différents segments grâce à un système de coupes très granulaires: de la désactivation des moteurs de shaders complets pour utiliser uniquement des groupes de travail en béton (WGP) par la possibilité de «désactiver» les contrôleurs de mémoire (BMI, bien qu'AMD les appelle individuels UMC) en blocs 64-bits.

Cela fait de RDNA 4 un design beaucoup plus utilisable dans la fabrication par TSMC, car à partir d'une seule puce, ils peuvent laisser plusieurs variantes, totalement parfaites et équilibrées, optimisées à la fois pour la gamme élevée et pour les gammes moyennes sans avoir besoin de doubler les efforts. Cela fait gagner du temps, mais beaucoup d'argent, ce qui rend chaque graphique plus rentable.

A lire également  Counter-Strike 2 vous expulsera du jeu avec un clavier SOCD

SOC: Motor de compression et de décompression centrale pour améliorer les performances et l'efficacité du tissu infini, architecture modulaire conçue à partir de zéro

AMD-RDNA-4-SOC-Compression-y-Descpruce-CentralAMD-RDNA-4-SOC-Compression-y-Descpruce-Central

Le deuxième gros bloc est celui de la compression et de la décompression centralisées. AMD a intégré un moteur dédié qui gère ce processus dans l'ensemble du flux de données entre les shaders, la mémoire, les caches et les blocs multimédias. La conséquence directe est double: d'une part, jusqu'à 15% de plus en plus est obtenu dans certains scénarios de rangement traditionnels, tandis que, d'autre part, l'utilisation de la bande passante dans le tissu infini est réduite d'environ 25%, ce qui se traduit par une consommation plus faible de chaque GPU.

L'avantage supplémentaire est que les développeurs n'ont plus à s'inquiéter de quels algorithmes de compression utilisent, car tout est intégré dans le matériel. Ou ce qui est la même, le logiciel est négligé pour que le matériel fasse le travail de l'intérieur.

Le troisième aspect que AMD a mis en évidence est l'architecture modulaire du SOC, où chaque bloc peut être réutilisé ou même divisé pour générer des variantes plus compactes. Ici, entre également un renforcement de sécurité inhabituel dans le GPU: les contrôles d'accès hiérarchiques, la réinitrialisation automatique en cas d'erreurs de parité et l'intégration des RAS dans des modules clés tels que les caches L3, la fabrication de l'infini ou les contrôleurs de mémoire.

Une donnée améliorée qui connecte le cache GL2 avec le LLC, BMI et DRM

AMD-RDNA-4-DATA-FLOW-DELAMD-RDNA-4-DATA-FLOW-DEL

Le point suivant est le flux de données au sein de chaque GPU, qui a été optimisé avec une infinité cohérente et une bande passante très élevée, capable de déplacer 1 Ko par cycle d'horloge à des fréquences comprises entre 1,5 et 2,5 GHz, selon l'état d'énergie. Les moteurs de shader se connectent au cache GL2 commun et de là vers un cadre de stations cohérentes, du cache de dernier niveau (LLC) et des contrôleurs de mémoire à double canal qui se déroulent dans le DRAM.

A lire également  "Tout comme nous produisons de l'électricité, nous allons générer de l'IA"

Cette refonte garantit qu'ils ont accès aux informations avec des latences inférieures, ce qui est la clé des charges de travail qui dépendent de grands volumes de données, tels que le traçage des rayons ou le traçage de chemin. Toutes ces pièces s'adaptent directement à ce que AMD avait déjà avancé autour de son nouvel ensemble d'instructions dans l'ADNr 4 et l'introduction du format de géométrie dense (DGF).

La plus grande efficacité de compression et de trafic interne est exactement ce qui est nécessaire pour gérer des géométries aussi denses sans mémoire saturée, tandis que l'infini à grande vitesse et cohérente devient la base pour prendre en charge les algorithmes BVH de traçage de rayons plus complexes.

Une architecture conçue pour FSR Redstone comme pierre angulaire: l'ADNr 4 est meilleur que prévu

AMD-RDNA-4-Architecture-soc-y-caractéristiquesAMD-RDNA-4-Architecture-soc-y-caractéristiques

Gardez à l'esprit que tout ce qui dit jusqu'à présent dans l'architecture est également très axé sur la nouvelle cache de radiance neuronale, le supersample et le débrassements neuronaux, c'est-à-dire FSR Redstone.

Ce n'est qu'une autre petite étape pour comprendre ce que AMD a déjà révélé officiellement et cela n'est pas encore venu. Désormais, l'architecture et les raisons de toutes les nouvelles caractéristiques mises en œuvre sont bien meilleures. En fait, ce qui semblait être une étape mineure car l'architecture a fini par être un grand pas en avant, oui, raconté par les fascicules.

De toute évidence, cela a été délibéré d'essayer de cacher leurs pas autant que possible et de ne pas donner lieu à Nvidia et Intel pour réagir. Si vous étiez avec le “battage médiatique”, préparez-vous, car tout semble mieux que prévu. Il ne faut que Redstone pour répondre aux réalités du matériel et abandonner au niveau attendu.