La Chine vient d’envoyer un message clair à Washington depuis Pékin : elle ne compte pas rester à la traîne dans la course à l’intelligence artificielle, même si les États-Unis tentent de restreindre l’accès aux microprocesseurs avancés. Lors de sa conférence Baidu World 2025, le géant technologique chinois a présenté deux nouveaux processeurs d’IA — Kunlun M100 et Kunlun M300 — ainsi qu’une architecture de supernœuds massifs Tianchi qui, sur le papier, visent directement à concurrencer la domination actuelle de Nvidia et d’autres fabricants occidentaux dans le domaine du calcul pour l’IA.
Ce n’est pas un simple lancement. Il constitue la pièce maîtresse d’une stratégie à long terme : doter la Chine d’une puissance de calcul souveraine, « contrôlable » et libérée des restrictions imposées depuis Washington.
Des sanctions américaines au « plan B » de Pékin
Depuis 2022, les États-Unis renforcent progressivement leurs restrictions à l’exportation de puces à haute performance et d’équipements de fabrication vers la Chine, avec des règles limitant directement la vente de GPU avancés de Nvidia, AMD, ainsi que l’accès à des outils critiques de lithographie et de conception.
Le but déclaré de la Maison-Blanche est de freiner la capacité de Pékin à entraîner des modèles d’IA de dernière génération, notamment ceux pouvant avoir une utilisation militaire ou de surveillance de masse. En conséquence, plusieurs grandes entreprises technologiques chinoises se sont tournées vers des alternatives nationales pour entraîner leurs modèles de langage et systèmes multimodaux.
Huawei a ouvert la voie en démontrant qu’il était possible de fabriquer des SoCs en 7 nm avec la société SMIC — comme le Kirin 9000S du Mate 60 Pro — malgré les sanctions et sans accès à la lithographie EUV. Mais dans le secteur des accélérateurs d’IA haute performance, le morceau manquant était des puces capables, même partiellement, de rivaliser avec les GPU de Nvidia dans les centres de données.
Les choses changent avec Baidu et sa gamme Kunlun.
Kunlun M100 et M300 : deux armes pour la bataille de l’IA
Lors de Baidu World 2025, la société a dévoilé sa nouvelle génération de puces Kunlun pour l’IA : le M100, optimisé pour l’inférence à grande échelle, et le M300, conçu pour l’entraînement et l’inférence de modèles fondamentaux multimodaux « ultra-gros ».
Les éléments clés sont :
- Kunlun M100
- Spécifiquement conçu pour l’inférence massive, avec des millions de requêtes IA quotidiennes.
- Particulièrement optimisé pour des architectures « Mixture of Experts » (MoE), qui active uniquement certaines parties du modèle selon la requête, pour plus d’efficacité.
- Le lancement commercial est prévu pour début 2026, et Baidu le présente comme le moteur pour exécuter à grande échelle des modèles comme Ernie en Chine.
- Kunlun M300
- Conçu comme une puce « tout-en-un » pour l’entraînement et l’inférence de modèles multimodaux de nouvelle génération, dotés de trillions de paramètres.
- Destiné à des modèles combinant texte, image, audio et vidéo dans un même cadre.
- Sa sortie sur le marché est attendue pour début 2027.
Baidu n’a pas encore divulgué publiquement le processus de fabrication ni tous les paramètres techniques de ces puces, une pratique courante en Chine après les sanctions. Mais le message officiel insiste sur trois concepts : la puissance, le faible coût et surtout la calculabilité « contrôlable » et locale pour les utilisateurs chinois, qui ne peuvent plus ou ne veulent plus dépendre du matériel américain.
Tianchi 256 et 512 : des supernœuds destinés à concurrencer (et défier) Nvidia
L’autre volet de l’annonce concerne l’architecture de supercalculateur qui les accompagne. Baidu a présenté deux « supernœuds » Tianchi — le Tianchi 256 et le Tianchi 512 — qui interconnectent plusieurs accélérateurs dans une seule unité logique, un peu à l’image des systèmes comme le Nvidia GB200 NVL72 ou le CloudMatrix 384 de Huawei.
Selon les informations communiquées par la société et des médias spécialisés :
- Le Tianchi 256 relie 256 puces P800 (la génération actuelle de Kunlun) et sera disponible en première moitié 2026.
- Le Tianchi 512 augmentera le nombre à 512 puces au second semestre de la même année.
Baidu affirme que, par rapport au supernœud présenté en avril dernier, le Tianchi 256 multiplie par quatre le débit maximal, améliore de plus de 50 % la performance globale et parvient à tripler le débit de tokens par GPU en inférence sur de grands modèles.
Le concept est clair : bien que chaque puce individuelle puisse être un ou deux pas en retard face aux GPU Nvidia de pointe, le réseau d’interconnexion et la conception du cluster cherchent à compenser cette différence en additionnant davantage de cartes tout en maximisant la communication entre elles.
Une feuille de route jusqu’en 2030 : du supernœud de 256 cartes au cluster d’un million
Au-delà des produits concrets, Baidu a esquissé une feuille de route de cinq ans pour sa famille Kunlun, visant un objectif ambitieux : construire, d’ici 2030, un cluster de un million de cartes Kunlun dans une « mégainfrastructure » d’IA unique alimentant sa plateforme Baige.
Les étapes clés annoncées comprennent :
- 2026 : déploiement de Tianchi 256 et Tianchi 512.
- 2028 : arrivée de supernœuds « millier de cartes », positionnant la Chine parmi les plus grands systèmes d’entraînement au monde.
- 2030 : objectif d’un cluster d’un million de cartes Kunlun opérant comme une seule unité logique, au moins en théorie.
Parallèlement, Baidu a présenté Ernie 5.0, un modèle de langage multimodal de 2,4 trillions de paramètres, capable de traiter texte, images, audio et vidéo, entraîné sur sa propre infrastructure basée sur des puces P800.
La conjugaison de puces, supernœuds et modèles compose la stratégie que Baidu veut promouvoir : la Chine construit son propre « stack » IA de bout en bout, du silicium jusqu’aux applications.
Un coup dur à la dépendance à Nvidia… en Chine
Le message politique de Baidu est limpide. Alors que les États-Unis durcissent ou assouplissent par intermittence leurs règles d’exportation de GPU vers la Chine, Pékin souhaite que ses grandes entreprises technologiques réduisent au minimum leurs achats de puces étrangères pour des centres de données stratégiques.
Avec les Kunlun M100 et M300, la société se présente comme une alternative nationale face aux GPU Nvidia et AMD, au moins pour une grande partie des charges de travail en IA commerciale et cloud. Il ne s’agit pas seulement de performance brute, mais aussi de sécurité réglementaire :
- Ils ne dépendent pas de licences d’exportation américaines susceptibles d’être modifiées à tout moment.
- Ils évitent le risque d’être piégés dans de nouvelles sanctions ou restrictions géopolitiques.
- Ils permettent au gouvernement chinois d’exiger que des données sensibles et des modèles critiques soient exécutés sur du hardware considéré comme « sûr et contrôlable ».
Simultanément, la stratégie de Baidu répond à une tendance plus large : la hostilité croissante en Chine envers les puces étrangères d’IA, avec inspections accruessur les importations de Nvidia et un contrôle renforcé sur ce qui entre dans le pays par ses ports.
Une véritable révolution dans le leadership mondial de l’IA ?
La question cruciale pour la communauté internationale est de savoir si cette offensive de Baidu peut réduire significativement l’avance que conservent encore les États-Unis et leurs alliés dans le domaine du calcul pour l’IA.
À court terme, la réponse semble prudente : les GPU de Nvidia continuent de dominer en matière de processus de fabrication, d’écosystème logiciel (CUDA), de bibliothèques et de communauté de développeurs. Quant aux fonderies chinoises, elles restent plusieurs nœuds en retrait par rapport à TSMC ou Intel en lithographie avancée.
Cependant, la donne évolue :
- La Chine a déjà montré qu’elle pouvait fabriquer des puces de 7 nm sans EUV et continuer à innover sur cette base.
- Des acteurs comme Baidu, Huawei et d’autres développent des systèmes de supernœuds qui s’appuient davantage sur le volume que sur une technologie extrême de chaque puce.
- Les modèles d’IA chinois se rapprochent de plus en plus de leurs homologues américains, avec des estimations indiquant que l’écart pourrait se réduire à quelques mois dans certains domaines.
Dans ce contexte, les Kunlun M100 et M300 ne transforment pas instantanément la Chine en leader du hardware IA, mais confirment une tendance : le pays n’est plus simplement un acheteur de chips américains, mais un concurrent doté d’une feuille de route propre.
Questions fréquentes
En quoi consistent précisément les puces Baidu Kunlun M100 et M300 pour l’intelligence artificielle ?
Le Kunlun M100 est optimisé pour l’inférence à grande échelle, notamment dans des modèles de type Mixture of Experts (MoE), et est destiné à exécuter des assistants, chatbots et services cloud avec des millions de requêtes quotidiennes. Le Kunlun M300, en revanche, cible à la fois l’entraînement et l’inférence de modèles fondamentaux multimodaux de nouvelle génération, capables de traiter texte, image, audio et vidéo, réservés pour les clusters les plus puissants de Baidu et ses grandes clients industriels.
Quel rôle jouent les supernœuds Tianchi 256 et Tianchi 512 dans la stratégie d’innovation de Baidu en IA ?
Les supernœuds Tianchi 256 et 512 rassemblent des centaines de puces Kunlun P800 dans une seule unité de calcul, avec une interconnexion très haute vitesse. Leur but est de compenser d’éventuelles limites face aux GPU étrangers en associant plus de cartes et en optimisant la communication interne. Baidu affirme que le Tianchi 256 quadruple le débit maximal, augmente de plus de 50 % la performance globale, et multiplie par 3,5 le throughput de tokens par GPU pour la déduction sur de grands modèles, constituant ainsi une infrastructure stratégique à venir.
Comment ces technologies influent-elles sur la dépendance de la Chine aux puces Nvidia ?
Ces innovations permettent à Baidu et à d’autres acteurs chinois de réduire leur dépendance aux restrictions d’exportation américaines et à la volatilité réglementaire liée aux GPU Nvidia. Bien que Nvidia domine toujours à l’échelle mondiale, Kunlun et les supernœuds Tianchi offrent une voie nationale pour entraîner et déployer des modèles avancés en Chine, tout en respectant les priorités de « sécurité et contrôle » du gouvernement chinois dans ses centres de données.
Que signifie la feuille de route de Baidu visant un cluster d’un million de cartes Kunlun d’ici 2030 ?
Ce projet sur cinq ans reflète une ambition : faire de Baidu l’un des plus grands opérateurs d’infrastructure de calcul IA dans le monde, avec un cluster de un million de cartes Kunlun dans une mégainfrastructure unique. La feuille de route prévoit d’atteindre des supernœuds de 256 et 512 cartes en 2026, puis des systèmes de milliers de cartes en 2028. Si cette vision est réalisée, d’ici 2030, Baidu pourrait entraîner et déployer des modèles d’IA gigantesques en s’appuyant quasiment uniquement sur du matériel 100 % chinois, renforçant ainsi l’autosuffisance technologique du pays face à l’Occident.
Baidu Unveils New Kunlun Chip M100·M300 and Two Next-Generation “Supernode” Solutions
• Baidu announced that it will introduce its next-generation AI chips, the Kunlun Chip (昆仑芯) M100 and M300.
Among them, the M100 is optimized for large-scale inference environments,… pic.twitter.com/cNB7j0ruO2— Jukan (@Jukanlosreve) 13 novembre 2025
Pourquoi un SSD devient-il lent après avoir cloné un HDD ? Causes réelles et comment retrouver sa vitesse