Les GPU RDNA 3 d’AMD avec 48 Go surpassent la RTX 4090 en IA, selon des benchmarks

Info Cloud

X (Twitter) Facebook Pinterest LinkedIn Email

AMD Prend l’Actualité avec de Nouveaux Résultats de Performance en Intelligence Artificielle

AMD a récemment révélé des résultats impressionnants concernant la performance de ses cartes graphiques professionnelles RDNA 3 de 48 Go, surpassant la RTX 4090 de Nvidia. D’après des tests réalisés avec l’outil DeepSeek R1, les modèles Radeon Pro W7900 et Radeon Pro W7800, tous deux dotés de 48 Go de VRAM, ont atteint jusqu’à 7,3 fois plus de performance que la RTX 4090 dans certains scénarios d’inférence de modèles de langage.

Résultats des Tests avec DeepSeek R1

David McAfee, vice-président et directeur général des CPU Ryzen et des graphismes Radeon chez AMD, a partagé sur la plateforme X (anciennement Twitter) une série d’évaluations effectuées avec les outils LM Studio 0.3.12 et Llama.cpp runtime 1.18, comparant les performances des GPU dans quatre configurations distinctes :

Test	RTX 4090	Pro W7800 48GB	Pro W7900 48GB
Distill Qwen 32B 8-bit	2,7 tokens/s	19,1 tokens/s	19,8 tokens/s
Distill Llama 70B 4-bit	2,3 tokens/s	12,8 tokens/s	12,7 tokens/s
Distill Qwen 32B 8-bit (variante)	2,5 tokens/s	15,7 tokens/s	16,2 tokens/s
Distill Llama 70B 4-bit (variante)	2,0 tokens/s	10,1 tokens/s	10,4 tokens/s

AMD met en avant que ses GPU RDNA 3 de 48 Go sont :

7,3 fois plus rapides dans le test Distill Qwen 32B 8-bit.
6,5 fois plus rapides dans une autre variante de Distill Qwen 32B 8-bit.
5,5 fois plus rapides dans le test Distill Llama 70B 4-bit.
5,2 fois plus rapides dans une autre variante de Distill Llama 70B 4-bit.

L’Importance de la VRAM dans les Modèles d’IA

Un des facteurs clés influençant la performance des modèles d’intelligence artificielle est la quantité de VRAM disponible. Pour les tâches d’inférence avec des modèles de langage étendu, les paramètres sont stockés directement dans la mémoire de la GPU. À cet égard, AMD soutient que ses modèles avec 48 Go de VRAM peuvent gérer les plus grands modèles de DeepSeek R1 sans avoir besoin de répartir la charge sur plusieurs GPU.

Un Coût Élevé

Cependant, ce bénéfice s’accompagne d’un coût non négligeable. La Radeon Pro W7900 de 48 Go est proposée au prix de 3 500 dollars, soit 1 500 dollars de plus que le prix de base de la RTX 5090 (2 000 dollars) et 2 000 dollars de plus que la RTX 4090 (1 500 dollars lors de son lancement). Malgré tout, cette carte reste plus abordable que la RTX A6000 Ada de 48 Go, la solution la plus proche de Nvidia en termes de capacité de VRAM.

La Réaction de Nvidia

Bien que ces résultats placent AMD en tant qu’option compétitive pour les charges de travail d’intelligence artificielle, la société a choisi de ne pas comparer ses GPU avec la nouvelle RTX 5090, le modèle phare le plus récent de Nvidia. Par le passé, lorsque AMD a publié des benchmarks similaires sur la RX 7900 XTX, Nvidia a réagi avec ses propres données, illustrant que sa GPU surpassait celle d’AMD dans des configurations similaires.

Nvidia devrait donc riposter avec de nouveaux benchmarks pour démontrer les performances de ses modèles les plus récents face aux RDNA 3 de 48 Go, surtout que la RTX 5090 est dotée de seulement 32 Go de GDDR7, contre les 48 Go des cartes d’AMD.

Le paysage des GPU pour l’intelligence artificielle continue d’évoluer. Bien qu’AMD affiche des avantages en matière de mémoire VRAM et de performance dans certains tests, la bataille pour la suprématie dans le domaine de l’IA entre Nvidia et AMD est loin d’être terminée.