La part de NVIDIA dans les puces IA en Chine diminue : la poussée locale et les restrictions à l’exportation réorganisent le tableau

La part de NVIDIA dans les puces IA en Chine diminue : la poussée locale et les restrictions à l’exportation réorganisent le tableau

La présence de NVIDIA sur le marché chinois des puces pour Intelligence Artificielle (IA) traverse une période de mutation majeure. Une analyse récente de Bernstein prévoit que la part de marché de la société en Chine pour les processeurs/acquéreurs IA pourrait passer de 66 % en 2024 à environ 8 % en 2026, à mesure que les fabricants locaux accélèrent leurs capacités de conception, de production et d’intégration dans les centres de données. La tendance fondamentale est claire : les contrôles à l’exportation américains sur les puces avancées agissent comme un catalyseur d’une substitution technologique que la Chine poursuit depuis plusieurs années, mais qui devient désormais une priorité stratégique et systématique.

Les prévisions de Bernstein reposent sur deux dynamiques parallèles. D’une part, la disponibilité des GPU et accélérateurs NVIDIA pour la Chine s’est restringue en raison du durcissement réglementaire et des exigences de licences. D’autre part, des entreprises chinoises comme Huawei, Cambricon, Moore Threads et MetaX gagnent du terrain avec des alternatives « suffisamment performantes » pour certains cas d’usage, notamment pour l’inférence et l’entraînement à grande échelle, où le déploiement s’appuie sur une augmentation du nombre de nœuds et une optimisation logicielle. L’analyse indique même que des fournisseurs locaux pourraient couvrir environ 80 % de la demande intérieure en accélérateurs IA.

Le facteur décisif : restrictions à l’exportation et redéfinition du catalogue

Ce changement stratégique ne peut s’analyser sans le contexte des contrôles à l’exportation des États-Unis. Depuis 2022, et surtout suite aux mises à jour de 2023, les règles ont été renforcées pour limiter l’accès de la Chine aux puces de calcul avancé et aux technologies associées à la supercalculations. En pratique, cela signifie qu’il devient difficile, voire impossible, de vendre les « dernières » innovations, ce qui oblige à développer des variantes spécifiques pour respecter des seuils techniques ou à demander des licences au cas par cas.

Dans ce cadre, NVIDIA a tenté de maintenir sa présence en proposant des produits adaptés à ces restrictions. Cependant, même ces stratégies ont montré leur fragilité. En avril 2025, la société annonçait qu’elle aurait besoin d’une licence pour exporter en Chine son puce H20 orientée IA, et anticipait un impact comptable de 5,5 milliards de dollars liés à l’inventaire et aux engagements, illustrant à quel point opérer dans un contexte réglementaire incertain dans une chaîne d’approvisionnement aussi capitalistique est coûteux.

Au début de 2026, le Département américain du Commerce a de nouveau modifié sa politique d’évaluation des licences pour certains semi-conducteurs destinés à la Chine, renforçant l’idée que la « fenêtre » commerciale est de plus en plus dépendante de conditions et garanties supplémentaires.

Huawei et la stratégie de « mise à l’échelle par cluster » pour réduire l’écart

Sur le plan technologique, la progression chinoise ne se limite pas à lancer un seul processeur et attendre qu’il rivalise avec la dernière génération occidentale. La stratégie dominante chez les acteurs locaux est gagner par le système, en combinant hardware domestique, réseaux, interconnexions, logiciels et déploiements massifs.

Dans ce contexte, Huawei apparaît comme le candidat le plus dynamique, notamment avec la gamme Ascend et sa vision de clusters de grande taille. Selon une analyse récente, Huawei trace une feuille de route comprenant la Ascend 950 (programmée pour 2026), avec des objectifs ambitieux de formats à faible précision, comme le FP8, et le renforcement de la performance par le biais de supercalculs à l’échelle de racks, où des milliers de puces travaillent comme un seul système.

La même étude souligne que, même si le rendement par puce reste encore inférieur à celui des GPU haut de gamme, la Chine tente de compenser cela par une ingénierie de cluster et par un écosystème logiciel local. Huawei pousse activement des frameworks et couches de programmation (par exemple, des alternatives nationales à CUDA et à des environnements d’entraînement) afin de réduire sa dépendance à la stack NVIDIA, qui a traditionnellement été l’un de ses avantages compétitifs les plus difficiles à reproduire.

Les “quatre petits dragons” et la bataille pour l’écosystème

Au-delà de Huawei, le marché chinois se peuple d’acteurs visant des niches précises dans l’accélération. Selon Bernstein, citant des sources spécialisées, des sociétés telles que Moore Threads, MetaX, Biren Technology et Suiyuan Technology poursuivent leur croissance, elles sont parfois désignées comme les “quatre petits dragons” de la scène GPU chinoise.

La clé ne réside pas seulement dans le silicium. Le véritable goulot d’étranglement se situe au niveau de la compatibilité logicielle : chaînes d’outils, compilateurs, bibliothèques, noyaux optimisés et support dans les frameworks populaires. La capacité d’un fournisseur à « gagner » n’est pas forcément liée à l’efficience brute de son chip, mais à sa capacité à faire migrer des milliers de développeurs sans réécrire une moitié de la plateforme. Aujourd’hui, la question n’est plus uniquement “quel chip est le plus rapide”, mais “quelle plateforme réduit le coût total d’adoption” dans les universités, services cloud locaux et grandes entreprises.

Impacts pour NVIDIA et le marché mondial de l’IA

Si la part de marché de NVIDIA en Chine pour les chips IA tombait à environ 8 %, l’impact ne serait pas seulement commercial, mais stratégique. La Chine, avec sa forte demande de puissance de calcul pour l’IA, perdrait en importance dans la dynamique mondiale, ce qui aurait deux effets secondaires majeurs :

  1. Stimulation d’une alternative */}
    : plus un stack domestique s’impose, plus ses outils, bibliothèques et savoir-faire s’affermissent, réduisant la dépendance historique à CUDA dans tout ou partie de l’écosystème.
  2. Fragmentation du marché : les multinationales pourraient être contraintes de développer des produits et des flux de travail différents selon les régions, ce qui accroîtrait les coûts et ralentirait le déploiement mondial.

De leur côté, les acteurs chinois font face à des limites liées notamment à leur capacité de production, à l’accès à certaines technologies de fabrication, ou à la disponibilité de mémoires avancées et de procédés d’emballage à grande échelle. Toutefois, la tendance est claire : les contraintes externes accélèrent la substitution interne, et le marché de l’IA en Chine semble s’orienter vers une répartition beaucoup plus domestique qu’il y a quelques années.


Questions fréquentes

Que signifie une baisse de la part de NVIDIA dans les chips IA en Chine à 8 % ?
Cela indique une perte de domination sur le marché chinois des accélérateurs IA, avec une montée en puissance des fournisseurs locaux, selon Bernstein. Il ne s’agit pas forcément du rendement technique, mais du partage des achats et déploiements dans la région.

Quelles entreprises chinoises gagnent du terrain dans les accélérateurs IA ?
Les analyses mentionnent Huawei, Cambricon, Moore Threads et MetaX, ainsi que d’autres fabricants qui cherchent à construire une offre locale de GPU/accélérateurs et de logiciels.

Pourquoi les contrôles à l’exportation influent-ils autant sur le marché des GPU pour l’IA ?
Parce qu’ils limitent la vente de certains chips en Chine, ce qui réduit l’offre de produits technologiques de pointe et pousse les acteurs à privilégier des alternatives nationales ou à investir dans le développement logiciel et la compatibilité locale.

Pourquoi l’écosystème (CUDA, frameworks, bibliothèques) est-il aussi crucial que le hardware ?
Parce que le coût de migration dépend fortement du logiciel : si l’entraînement, le déploiement et la gestion des modèles nécessitent une réécriture complète, le processus est ralenti. La Chine tente donc de reproduire non seulement le hardware, mais aussi tout le stack logiciel qui permet une productivité optimale des équipes d’ingénierie.

le dernier