Shenzhen active un cluster de IA de 14.000P avec une technologie chinoise de bout en bout

Info Cloud

X (Twitter) Facebook Pinterest LinkedIn Email

Shenzhen a lancé un nouveau cluster de calcul dédié à l’Intelligence Artificielle qui, selon les informations diffusées par le gouvernement local et par des médias spécialisés, atteint désormais une capacité totale de 14 000 PFLOPS après l’ajout d’une nouvelle phase de 11 000 PFLOPS à un déploiement antérieur de 3 000 PFLOPS. L’enjeu ne réside pas uniquement dans cette donnée, mais surtout dans l’approche adoptée : il s’agit du premier cluster chinois de niveau “10 000 cartes” construit avec une infrastructure technologique entièrement domestique, englobant accélérateurs, réseau, stockage, logiciel d’orchestration et gestion du système, de bout en bout.

La mise en service officielle de cette deuxième phase a eu lieu le 26 mars 2026, selon la municipalité de Shenzhen. Elle s’inscrit dans une stratégie visant à renforcer une base de calcul “autonome et contrôlable”, dans un contexte où la Chine cherche à réduire sa dépendance aux composants matériels et logiciels étrangers pour le entraînement de grands modèles d’IA. Plus qu’un simple projet d’échelle, il sert de référence industrielle pour évaluer si le pays peut soutenir un environnement complet d’IA avec ses propres outils, et pas uniquement avec des puces nationales isolées dans des infrastructures hybrides.

Le système repose sur des accélérateurs Huawei Ascend 910C et sur l’écosystème Ascend + CANN, d’après les données officielles de Shenzhen. La ville le décrit comme le premier cluster chinois réunissant des super-nœuds Ascend 910C à cette échelle. Selon Digitimes, ce déploiement comprend environ 14 000 unités Ascend 910C intégrées dans une architecture de super-nœuds conçue pour minimiser la latence et réduire le trafic entre nœuds. Cette précision est essentielle, car pour les grands clusters d’IA, il ne suffit plus d’empiler des cartes : le réseau, la planification des tâches et la gestion des erreurs comptent autant que la puissance brute.

Plus que la puissance : une ingénierie systémique

La lecture la plus pertinente de ce projet réside dans cette dimension. La Chine avait déjà déployé ses propres puces dans divers environnements, mais le véritable défi résidait dans les couches intermédiaires : interconnexion, logiciel, gestion des ressources et opérations à grande échelle. Le cluster de Shenzhen tente de résoudre ce problème par une architecture plus compacte et coordonnée, où les ressources sont regroupées en super-nœuds connectés par une interconnexion à très haute vitesse et une couche de gestion distribuée. Selon Digitimes, cette approche vise à dépasser trois limites classiques des grands clusters : les goulets d’étranglement en communication, la complexité opérationnelle et la propagation des erreurs.

La municipalité met aussi en avant ce projet comme une infrastructure utile, pas seulement une vitrine politique. Les informations officielles évoquent un soutien à la réseau national intégré de calcul, au développement de grands modèles chinois et au renforcement de l’écosystème de puces domestiques. Un marché indique aussi que la capacité de la première phase a été rapidement intégralement utilisée, avec près de 50 entreprises, universités et instituts de recherche ayant signé des accords cadre pour la nouvelle phase, avec un taux d’utilisation global d’environ 92 %.

Cela laisse penser que le défi n’est plus uniquement d’attirer la demande, mais de démontrer qu’elle peut être satisfaite de manière stable et fiable. En somme, Shenzhen ne compete pas seulement en puissance nominale, mais dans la capacité à fournir un calcul utile et soutenu pour l’entraînement et l’inférence de modèles. C’est le véritable enjeu de toute infrastructure de cette envergure.

Les chiffres que Shenzhen souhaite mettre en avant

Une partie de l’intérêt du projet réside également dans les métriques rendues publiques, bien que la prudence soit de mise. La municipalité ne détaille pas tous les indicateurs techniques dans ses déclarations, mais certains médias spécialisés rapportent que la première phase de 3 000 PFLOPS affichait une taux de panne moyen quotidien de 0,3‰, une linéarité d’entraînement de 93,12 % avec le modèle Pangu-718B, et un PUE (Power Usage Effectiveness) de 1,08. Ces chiffres, ambitieux, renforcent l’idée d’une infrastructure efficace et fiable, mais n’ont pas encore été vérifiés par une audit indépendant.

Cependant, ces indicateurs correspondent aux problématiques actuelles du secteur : de grands clusters d’IA échouent généralement si la communication entre nœuds se dégrade, si la consommation explose ou si les longues opérations accumulent des interruptions. D’où l’insistance sur des concepts comme les super-nœuds, l’interconnexion nationale à haute vitesse, la refroidissement liquide et la planification centralisée. L’objectif clair est de transformer le calcul pour l’IA en une capacité industrielle maîtrisable, plutôt qu’une accumulation peu contrôlée de serveurs et cartes.

Un élément de plus dans la course chinoise à la souveraineté technologique

Le contexte géopolitique est également évident. Après les restrictions américaines sur l’exportation de composants avancés, la Chine a accéléré ses efforts pour bâtir une chaîne d’approvisionnement en IA moins dépendante de l’extérieur. Shenzhen veut se positionner comme un nœud stratégique dans cette trajectoire. Le plan municipal avait d’ailleurs pour objectif, dès 2025, de dépasser 80 exaflops de capacité intelligente disponible en 2026, tout en développant plusieurs clusters de grande taille et en connectant en réseau métropolitain à faible latence différents pôles régionaux.

Ce projet dépasse donc la seule ville. S’il parvient à maintenir des taux de charge, une compatibilité logicielle et une stabilité opérationnelle élevés, il pourrait devenir une référence pour d’autres déploiements chinois reposant sur des technologies nationales. À l’inverse, si l’interopérabilité ou la fiabilité réelle venait à faire défaut, le cluster ne serait qu’un symbole plutôt qu’une plateforme productive. Pour l’heure, Shenzhen tente de prouver le premier scénario.

Questions fréquentes

Que signifie que le cluster atteigne 14 000 PFLOPS ?
Cela indique que la capacité totale déclarée s’élève à 14 000 pétaflops en additionnant la nouvelle phase de 11 000 PFLOPS et la phase précédente de 3 000 PFLOPS. Cette métrique mesure la puissance de calcul agrégée du système.

Quels chips sont utilisés dans le cluster de Shenzhen ?
Selon les données officielles et sectorielles, le système s’appuie notamment sur les accélérateurs Huawei Ascend 910C et sur l’écosystème logiciel Ascend + CANN.

Le système est-il entièrement domestique ?
C’est la position officielle du projet et des autorités de Shenzhen, qui le décrivent comme le premier cluster chinois de niveau “10 000 cartes” construit avec une pile technologique nationale de bout en bout. Cependant, certaines couches techniques précises proviennent de matériaux issus de sources spécialisées, et non d’une vérification publique indépendante.

Pourquoi ce projet est-il important pour la Chine ?
Parce qu’il ne test pas uniquement des puces, mais aussi la capacité de la Chine à déployer une infrastructure complète d’IA — calcul, réseau, stockage, logiciels, gestion — avec une technologie propre et à l’échelle industrielle.

source : digitimes