Des difficultés de vente pour les nouveaux serveurs IA GB300 de Nvidia
Malgré des promesses de performances sans précédent, les nouveaux serveurs d’intelligence artificielle GB300 basés sur les cartes Nvidia Blackwell Ultra n’attirent pas l’intérêt escompté. Des géants comme Microsoft auraient réduit leurs commandes en raison des problèmes rencontrés avec la génération précédente, les GB200.
Nvidia, reconnu mondialement pour sa puissance en informatique accélérée et intelligence artificielle, fait face à un revers inattendu. Son nouveau système ambitieux, le GB300 NVL72, qui repose sur les cartes révolutionnaires Nvidia Blackwell Ultra, peine à convaincre certains de ses principaux clients dans l’industrie des services cloud et des centres de données.
Qu’est-ce que les Blackwell Ultra ?
Présentées lors de la GTC 2025, les cartes Blackwell Ultra représentent un bond générationnel majeur depuis la série Hopper. Elles sont spécialement conçues pour répondre aux défis de l’ère du raisonnement en IA, où les modèles linguistiques et d’apprentissage profond ne se contentent plus de générer texte ou images, mais sont également capables de raisonner, planifier et répondre dans des contextes de plus en plus complexes.
Ces GPU intègrent des avancées significatives, telles que :
- Le double de l’accélération pour les couches d’attention, essentielles pour les LLMs.
- 1,5 fois plus d’opérations de point flottant par seconde (FLOPS) par rapport à Hopper.
- Jusqu’à 288 Go de mémoire HBM3e avec une bande passante améliorée.
- SuperNIC ConnectX-8, offrant 800 Gb/s de connectivité par GPU.
- Une architecture NVIDIA NVLink de 5e génération pour une communication optimale entre les nœuds.
Montées dans des configurations comme le GB300 NVL72, ces cartes permettent de créer de véritables "usines d’IA", unifiées grâce à des CPU Grace ARM et une architecture de refroidissement liquide à l’échelle du rack. Nvidia a promis des améliorations de performance allant jusqu’à 50x pour l’inférence par rapport à sa plateforme précédente Hopper, ainsi qu’un rendement 10x en transactions par seconde (TPS) par utilisateur et 5x en efficacité énergétique.
Pourquoi Nvidia n’atteint-elle pas ses objectifs de vente ?
Selon le média taïwanais Ctee, plusieurs grandes entreprises de services cloud, dont Microsoft, seraient en train de "rejeter" ou de "retarder" leurs commandes pour ces nouveaux systèmes. Les raisons évoquées ne sont pas seulement liées au coût élevé, mais aussi aux mauvaises expériences accumulées avec les serveurs GB200, également basés sur la technologie Blackwell, dont l’adoption a été problématique en raison :
- De problèmes initiaux de performance et d’intégration, attribués à l’emballage avancé de TSMC.
- De longues et complexes installations qui ralentissent le déploiement.
- D’une dépendance technique exclusive à Nvidia pour résoudre les erreurs, créant des goulets d’étranglement en matière de maintenance et de support.
- D’un écosystème encore immature en matière de logiciels et d’outils d’optimisation pour exploiter pleinement la nouvelle architecture.
Conséquence directe, Nvidia ne prévoit de distribuer que 15 000 serveurs GB200 en 2025, un chiffre très inférieur à celui réalisé avec Hopper. Cela a terni la confiance envers le GB300, dont la production de masse pourrait être reportée à 2026 si la demande ne s’améliore pas.
Les entreprises privilégient la stabilité à l’innovation
Malgré des spécifications impressionnantes, les clients semblent s’orienter vers des plateformes plus stables et matures, comme les serveurs HGX H100 et H200, qui dominent encore l’inférence et l’entraînement des modèles à grande échelle. Ces solutions, soutenues par des années d’optimisation et de support, présentent un risque opérationnel moindre pour des projets sensibles ou nécessitant une disponibilité critique.
En revanche, les GB300 NVL72 en sont encore à leurs débuts. Leur complexité d’installation, leur forte consommation énergétique et leur dépendance à des écosystèmes propriétaires incitent de nombreuses entreprises à hésiter avant de s’engager à grande échelle.
Conclusion : Nvidia est-elle en train de trébucher sur son propre rythme ?
Nvidia a été le moteur de l’essor de l’IA générative. Cependant, son pari ambitieux avec le Blackwell GB300 semble avoir pris de l’avance sur ce que ses partenaires sont prêts à suivre pour le moment. Bien que personne ne doute du potentiel technique de la nouvelle architecture, le marché semble clairement exiger maturité, stabilité et support, au lieu de promesses de performance.
La société dirigée par Jensen Huang devra ajuster sa stratégie de déploiement, améliorer le support après-vente et réduire les barrières à l’entrée si elle souhaite voir le Blackwell réussir à l’échelle que Hopper a un jour réalisée. L’avenir de l’informatique accélérée dépendra tant du matériel que de la confiance de l’écosystème qui l’entoure.