Huawei cherche à franchir l’un des plus grands obstacles qui ont protégé NVIDIA dans le domaine de l’intelligence artificielle : non seulement la puissance de ses accélérateurs, mais aussi la domination de CUDA en tant qu’environnement de développement de facto. Cette tendance se confirme avec l’intérêt croissant des grandes entreprises technologiques chinoises pour le nouveau Ascend 950PR, une puce qui, selon Reuters, commence à convaincre des clients comme ByteDance et Alibaba non pas tant par une supériorité brute en calcul, mais par une compatibilité accrue avec l’écosystème de développement auquel de nombreux développeurs IA sont déjà habitués.
Huawei a depuis un certain temps progressé dans sa gamme Ascend et dans CANN, sa plateforme logicielle pour la computation en IA. Mais le vrai défi n’était pas seulement de fabriquer une puce compétitive, mais aussi de réduire les coûts de migration depuis NVIDIA. C’est là où le discours commence à évoluer. Lors de HUAWEI CONNECT 2025, la société a annoncé que la prochaine génération d’Ascend supporterait à la fois les paradigmes SIMD et SIMT, une démarche qui vise directement le territoire où CUDA a été dominant pendant des années. Reuters affirme désormais que cette plus grande proximité avec le modèle de développement de NVIDIA explique une partie du regain d’intérêt que suscite l’Ascend 950PR chez les hyperscalers chinois, par rapport aux générations précédentes.
Il ne s’agit pas ici de dire que Huawei a « copié CUDA » au sens strict, ni que le marché chinois est prêt à abandonner brusquement le matériel NVIDIA. Ce qui semble plutôt se dessiner, c’est une approche plus pragmatique : Huawei rapproche son environnement de développement du langage mental des programmeurs qui travaillent déjà avec des GPU NVIDIA, en réduisant friction, temps d’adaptation et barrières à l’entrée. Dans un marché où les restrictions à l’exportation américaines compliquent l’accès aux puces occidentales avancées, cette évolution logicielle peut être aussi cruciale que le hardware lui-même.
L’Ascend 950PR vise l’inférence, les recommandations et les déploiements à grande échelle
Sur le plan technique, Huawei avait déjà esquissé le profil de l’Ascend 950PR plusieurs mois avant sa commercialisation. Lors d’une keynote officielle en septembre 2025, la société expliquait que cette puce était conçue pour les scénarios de pré-remplissage en inférence et pour les systèmes de recommandation, deux domaines où le parallélisme, la rapidité de réponse et le coût par déploiement sont critiques. Selon Huawei, le 950PR offre 1 PFLOPS en FP8 et 2 PFLOPS en FP4, avec en outre une bande passante d’interconnexion de 2 To/s, des chiffres qui le placent nettement au-dessus de la génération Ascend 910C en termes de connectivité interne et de support pour les formats de faible précision.
Huawei a également précisé que le 950PR utiliserait HiBL 1.0, une mémoire HBM maison conçue pour offrir un équilibre entre coût et performance dans les scénarios d’inférence et de recommandation. La société affirme que cette solution permet d’affiner l’investissement matériel selon les besoins, notamment pour des clients qui ne nécessitent pas la puissance d’un entraînement massif. Dans cette optique, Huawei différencie l’Ascend 950PR, davantage destiné à l’inférence et aux recommandations, de l’Ascend 950DT prévu pour le décodage et même la formation.
L’élément industriel le plus visible de cette stratégie est la carte Atlas 350, annoncée par Huawei et basée précisément sur l’Ascend 950PR. Selon le matériel officiel de la marque, cette accélératrice doble la capacité de calcul vectoriel par rapport aux générations précédentes et améliore de 2,5 fois la performance dans les services de recommandation. Huawei insiste également sur le fait que l’Atlas 350 peut fonctionner en tant que carte autonome ou en configuration avec des ressources partagées, ce qui indique clairement que la société souhaite faciliter à la fois des déploiements ponctuels et une montée en échelle au sein de clusters plus vastes.
Le logiciel peut avoir plus de valeur que quelques téraflops supplémentaires
Ce qui explique réellement l’intérêt du marché chinois pour cette puce ne se limite pas au nombre de PFLOPS. C’est surtout le logiciel. Reuters a indiqué le 27 mars que ByteDance et Alibaba envisagent de passer commande après avoir vérifié que cette fois, la puce est plus compatible avec le système CUDA de NVIDIA et offre de meilleurs temps de réponse. L’agence précise également que Huawei espère produire environ 750 000 unités cette année, la production de masse étant sur le point de démarrer, avec des livraisons complètes prévues pour le second semestre 2026.
Ce détail est essentiel, car il marque une mutation dans l’attitude des clients, allant au-delà de l’amélioration du produit. Pendant des années, l’atout majeur de NVIDIA en IA n’a pas été uniquement ses performances hardware, mais aussi la combinaison de CUDA, de bibliothèques, de frameworks, d’outils, de documentation, et surtout d’une vaste communauté de développeurs maîtrisant cet environnement. La Chine a cherché à développer ses propres alternatives, mais une grande partie de ses acteurs technologiques préférait encore NVIDIA, même lorsque l’accès au hardware était plus difficile. Si l’Ascend 950PR parvient à réduire cette dépendance à l’écosystème CUDA, Huawei n’a pas besoin d’égaliser NVIDIA dans tous les domaines pour devenir beaucoup plus pertinent sur son marché local.
Mais attention à ne pas trop exagérer. Reuters précise que le nouveau chip ne dépasse pas nécessairement NVIDIA en calcul brut pour tous les usages, et Huawei lui-même indique une stratégie plus ciblée que substitutive immédiate. La capacité de production, le rythme d’adoption par les grands clients, et la capacité de Huawei à convertir cette compatibilité améliorée en déploiements massifs restent des facteurs clés.
La vraie menace pour NVIDIA vient de Chine, pas du reste du monde
L’impact immédiat de cette évolution se joue principalement en Chine. La combinaison des sanctions, restrictions à l’export, pression politique pour développer une infrastructure nationale, et difficulté d’accès aux GPU occidentaux, a créé un terreau favorable pour qu’une alternative locale prenne du terrain, même si elle n’est pas encore totalement supérieure dans tous les aspects. Huawei a compris que la meilleure manière de se faire une place n’était pas uniquement de fabriquer plus de puissance brute, mais aussi de parler un langage plus familier pour les développeurs IA.
C’est précisément cette stratégie qui menace le monopole de NVIDIA en Chine. Non pas parce que Huawei détruit soudainement la supériorité technologique de CUDA, mais parce qu’elle commence à en réduire l’exclusivité. Si les grands clients chinois perçoivent que le coût de la migration devient acceptable, le marché pourrait se réorganiser très différemment de ces dernières années. L’Ascend 950PR, à lui seul, ne bouleverse pas tout le paysage. Mais il pourrait bien être le premier puce chinoise à réellement mener une lutte sérieuse pour le contrôle de l’écosystème, au-delà du matériel.
Questions fréquemment posées
Qu’est-ce que l’Huawei Ascend 950PR ?
C’est un accélérateur IA de nouvelle génération, conçu principalement pour l’inférence en phase de pré-remplissage et pour les systèmes de recommandation. Huawei l’a présenté officiellement dans le cadre de sa feuille de route Ascend 950.
Pourquoi dit-on que l’Ascend 950PR se rapproche de CUDA ?
Parce qu’Huawei a renforcé CANN et la prochaine génération d’Ascend avec le support des paradigmes SIMD et SIMT. Reuters indique que plusieurs clients apprécient une compatibilité accrue avec l’écosystème de développement de NVIDIA.
Alibaba et ByteDance ont-ils déjà commandé la puce ?
Reuters rapporte que ces deux entreprises envisagent de faire des achats après tests, mais ces plans doivent être considérés comme des informations de marché provenant de sources, et non comme des contrats officiellement signés.
Huawei peut-elle déjà remplacer NVIDIA en Chine ?
Pas encore entièrement. Mais l’Ascend 950PR montre que Huawei ne se limite plus au hardware ; elle investit également dans le logiciel et l’expérience utilisateur, ce qui était longtemps le point fort de NVIDIA.
Source : wccftech