Lors de la Conférence mondiale sur l’intelligence artificielle (WAIC) tenue à Shanghai, Huawei a dévoilé pour la première fois son nouveau cluster d’intelligence artificielle, le CloudMatrix 384, également appelé Atlas 900 A3 Superpod. Conçu pour rivaliser directement avec les solutions les plus avancées du marché, comme le système NVIDIA GB200 NVL72, il double ses performances en tâches de précision BF16, selon la société.
Ce nouveau cluster intègre 384 puces Ascend 910C reliées par une architecture de connectivité « all-to-all topology », permettant une coopération intensive et une faible latence entre les processeurs. Bien que chaque puce Ascend ait une performance inférieure à celle des GPU Blackwell de NVIDIA, Huawei compense cette différence par une intégration à grande échelle, atteignant une capacité de calcul totale de 300 pétaFLOPS en BF16.
Le CloudMatrix 384 ne se contente pas de doubler la performance en FP16 par rapport au système de NVIDIA ; il offre également une capacité mémoire 3,6 fois supérieure et un débit de bande passante 2,1 fois plus important que son concurrent américain. Cependant, cette puissance a un coût énergétique élevé, avec une consommation presque quatre fois supérieure à celle du GB200 NVL72, et le prix de chaque unité s’élève à environ 8 millions de dollars, contre près de 3 millions pour le système de NVIDIA.
Malgré ces coûts, Huawei ne vise pas uniquement la compétitivité économique. La société souhaite démontrer qu’elle peut produire en interne des solutions de pointe, sans dépendance aux composants occidentaux. Ce mouvement est crucial dans un contexte de restrictions à l’exportation de technologies avancées vers la Chine.
Huawei insiste sur le fait que ce système a été entièrement développé avec ses ressources propres, consolidant ainsi son rôle de leader dans l’infrastructure d’IA en Chine. Présenté initialement en interne lors de sa conférence des développeurs en mai, il est désormais présenté au public international pour la première fois.
L’architecture du super nœud permet au cluster de fonctionner comme une machine unique, optimisant la communication entre le calcul, le stockage et les réseaux. Il s’agit d’une plateforme idéale pour l’entraînement de modèles à grande échelle, l’IA générative, ainsi que pour des applications en temps réel telles que l’analyse prédictive et la robotique avancée.
Les analystes internationaux considèrent déjà le CloudMatrix 384 comme une pièce maitresse dans la stratégie chinoise de réduction de la dépendance technologique. Selon certains investisseurs, ce système représente une « avance d’une génération » par rapport aux produits actuels de NVIDIA et AMD, capable de changer l’équilibre des pouvoirs sur le marché mondial de l’intelligence artificielle.
Parallèlement, Huawei continue de renforcer son écosystème Ascend avec des outils de développement, des frameworks optimisés et des alliances stratégiques. La volonté de rivaliser au sommet du matériel AI n’est pas seulement technique : Huawei cherche aussi à prouver que la Chine peut jouer à armes égales dans la course à la suprématie technologique en IA.
La présentation du CloudMatrix 384 marque donc une étape clé dans l’évolution de l’informatique haute performance orientée IA, avec des répercussions potentielles sur les centres de données du monde entier dans les années à venir.
Source et photos : MyDrivers