DeepSeek retard son modèle R2 d’intelligence artificielle en raison de la pénurie de GPU NVIDIA en Chine.

OpenAI fait face à une pénurie de GPU pour déployer GPT-4.5 : L'IA à grande échelle qui attend toujours

Les restrictions américaines sur les puces H20 freinent le développement d’un projet d’IA prometteur en Chine

Le progrès du nouveau modèle R2 de DeepSeek, un acteur émergent de l’écosystème de l’intelligence artificielle en Chine, rencontre des obstacles en raison d’une pénurie de processeurs NVIDIA H20, comme le rapporte The Information. La société, qui a gagné en notoriété avec le lancement de son modèle R1, n’a pas encore confirmé la date de lancement de son successeur, le R2.

D’après des sources proches du projet, DeepSeek travaille assidûment sur le développement du R2, bien que son PDG, Liang Wenfeng, ne soit pas encore satisfait de ses performances. L’entreprise continue d’optimiser le modèle en interne avant d’autoriser son déploiement définitif.

Un modèle alimenté par 50 000 GPUs NVIDIA

Le modèle R1 a été entraîné à l’aide d’un colossal cluster de 50 000 GPUs Hopper, comprenant 30 000 unités H20, 10 000 H800 et 10 000 H100. Ces ressources ont été fournies par l’investisseur High-Flyer Capital Management. Le R1 a été rapidement adopté par des entreprises émergentes, de grandes sociétés et des entités liées au gouvernement chinois, la majorité l’exécutant principalement sur des puces H20.

Cependant, les restrictions imposées par le gouvernement américain depuis avril 2025 sur l’exportation de processeurs H20 commencent à engendrer des problèmes concrets : elles limitent non seulement l’utilisation du R1, mais compliquent également la préparation de l’environnement nécessaire pour déployer le R2 à grande échelle.

La faiblesse de l’IA chinoise : la dépendance vis-à-vis du matériel américain

Malgré le fait que le H20 soit une version limitée de la puissante puce H100, il est devenu une option populaire parmi les entreprises chinoises en raison de sa compatibilité avec l’écosystème CUDA de NVIDIA. DeepSeek, comme de nombreuses autres entreprises du secteur, a optimisé son logiciel pour fonctionner avec cette architecture, ce qui se révèle maintenant un point faible devant les fluctuations de la politique internationale.

NVIDIA avait réussi à vendre des milliards de dollars en puces H20 chaque trimestre aux entreprises chinoises avant les restrictions, ce qui montre à quel point l’IA en Chine reste dépendante du matériel américain, malgré les efforts pour encourager une industrie nationale indépendante.

Pendant ce temps, des plateformes de cloud computing chinoises ont averti que si le modèle R2 surpassait les modèles open source actuels en performance, sa demande pourrait rapidement dépasser la capacité de traitement disponible dans le pays.

Accusations réciproques et tensions croissantes

Ce tableau est assombri par la tension croissante avec les entreprises occidentales : selon certaines sources, OpenAI aurait accusé DeepSeek d’utiliser des modèles propriétaires au cours du développement du R1, bien que la société chinoise n’ait pas répondu publiquement à ces allégations.

DeepSeek avait vanté avoir créé le R1 avec moins de ressources que des géants comme OpenAI, mais cette situation souligne que même les acteurs les plus avancés de l’IA chinoise opèrent encore dans un équilibre technologique fragile, vulnérable aux décisions politiques et commerciales extérieures.

En résumé

Le blocage des GPUs de NVIDIA ralentit non seulement le progrès de DeepSeek, mais il sert également de rappel à la dépendance structurelle qui existe encore au sein du secteur technologique mondial, même parmi ceux qui sont à la pointe de l’intelligence artificielle.

Source : The Information

le dernier