La Chine se lance dans la course à l’intelligence artificielle avec une architecture système impressionnante reposant sur ses propres puces Ascend 910C.
Alors qu’une pénurie mondiale de GPU sévit et que les États-Unis dominent le développement de modèles d’intelligence artificielle grâce aux systèmes de NVIDIA, la Chine a riposté avec une proposition étonnamment solide. Huawei a présenté le AI CloudMatrix 384, une architecture de supercalcul qui, bien qu’elle repose sur des puces individuelles moins puissantes, surpasse les systèmes américains grâce à une infrastructure massivement évolutive et efficace.
Plus de GPU, plus de performance… à un coût énergétique plus élevé
Le CloudMatrix 384 repose sur la connexion de 384 GPU Ascend 910C via une topologie all-to-all, permettant une communication directe et parallèle entre chaque accélérateur. Bien que ces puces n’offrent qu’une fraction des performances unitaires par rapport aux GB200 de NVIDIA (utilisées dans le système NVL72), le design de Huawei parvient à surpasser son concurrent en termes de performance globale du système :
- 300 PFLOPS de performance en précision BF16 (contre 180 PFLOPS pour le NVL72).
- 3,6 fois plus de mémoire HBM disponible.
- 2,1 fois plus de bande passante mémoire.
Le système se déploie sur 16 racks, 12 d’entre eux équipés de GPUs et 4 racks intermédiaires dédiés à des commutateurs réseau évolutifs interconnectés par plus de 6 900 transcepteurs optiques 400G. Cette échelle massive rappelle la plateforme NVL256 « Ranger » de NVIDIA, qui a finalement été abandonnée en raison de son coût et de sa consommation élevés.
Huawei gagne en échelle, mais perd en efficacité
En termes d’efficacité énergétique, NVIDIA conserve l’avantage :
- 2,3 fois plus de puissance par FLOP que Huawei.
- Une consommation inférieure par TB/s de bande passante et par TB de mémoire HBM.
Cependant, ce point est moins critique pour la Chine, où il n’existe pas de restrictions significatives sur la consommation électrique dans les centres de données d’IA, contrairement aux États-Unis ou à l’Europe. En fait, le pays asiatique a ajouté au cours de la dernière décennie une capacité énergétique équivalente à l’ensemble du réseau électrique américain, en partie grâce à des investissements massifs dans des sources telles que le nucléaire et le charbon.
Dépendance technologique et limites de production
Bien que la conception de la puce Ascend 910C soit entièrement chinoise, sa fabrication dépend toujours d’acteurs internationaux. La plupart des unités produites jusqu’à présent sont fabriquées avec une lithographie de 7 nm de TSMC, et Huawei a réussi à contourner certaines sanctions en passant par des tiers tels que Sophgo. De plus, l’accès continu aux mémoires HBM de Samsung, qui ont continué d’arriver malgré les contrôles à l’exportation, a été facilité par des intégrations avec des puces logiques à faible performance.
Cependant, la Chine progresse dans sa capacité de fabrication domestique, avec des usines comme SMIC et CXMT qui étendent leurs opérations. Si cette production locale s’intensifie, Huawei pourrait multiplier le nombre de chips disponibles pour alimenter ses futurs systèmes CloudMatrix.
IA sans limites : plus d’échelle et moins de barrières
L’approche de Huawei est claire : si vous ne pouvez pas rivaliser chip à chip, faites-le système par système. Le CloudMatrix 384 est une réponse stratégique qui démontre comment l’intelligence artificielle ne se gagne pas uniquement avec l’architecture la plus avancée, mais aussi avec la capacité d’intégrer, d’évoluer et de soutenir des opérations à grande échelle sans contraintes énergétiques ni réglementaires.
En résumé, Huawei a trouvé un moyen de rivaliser avec les géants américains en IA, non pas sur l’efficacité individuelle, mais sur la puissance brute collective. Bien que le coût énergétique soit élevé, le système est fonctionnel et peut soutenir les plans ambitieux de la Chine en matière d’intelligence artificielle, réaffirmant sa détermination à ne pas rester à la traîne dans cette nouvelle course technologique mondiale.
Source : Semianalysis