La chaîne d’approvisionnement du GB200 de NVIDIA, une solution en rack conçue pour des charges de travail en intelligence artificielle (IA) et en calcul haute performance (HPC), nécessite encore du temps supplémentaire pour l’optimisation et l’ajustement, selon le dernier rapport de TrendForce. La complexité des spécifications du GB200, telles que sa haute puissance thermique (TDP) et les interfaces d’interconnexion à haute vitesse, a entraîné des retards dans la production et la distribution. En conséquence, le pic des expéditions ne sera pas atteint avant la période comprise entre le deuxième et troisième trimestre de 2025.
Haute puissance et complexité technique
La série GB de NVIDIA, qui comprend les modèles GB200 et GB300, est principalement destinée aux grands fournisseurs de services cloud (CSP) et aux centres de données de deuxième catégorie, aux institutions académiques et aux nuages souverains nationaux qui nécessitent des systèmes avancés en IA et en HPC.
Le modèle GB200 NVL72 est prévu pour dominer le marché en 2025, représentant jusqu’à 80 % des déploiements totaux alors que NVIDIA accélère son déploiement sur le marché. La clé de sa performance réside dans l’utilisation de NVLink de cinquième génération, une technologie d’interconnexion qui double la bande passanteLa bande passante est la capacité maximale de transfert d… par rapport au PCIe 5.0, le standard actuel du secteur.
Cependant, le GB200 présente des défis en termes de puissance et de refroidissement :
- Le TDP des racks HGX actuels, qui dominent le marché des serveurs IA, varie entre 60 kW et 80 kW.
- En comparaison, le GB200 NVL72 atteint un TDP de 140 kW, ce qui double les exigences énergétiques.
Le refroidissement liquide, une nécessité impérative
Le refroidissement traditionnel par air est insuffisant pour gérer ces charges thermiques extrêmes. L’adoption de solutions de refroidissement liquide est en croissance rapide :
- Unités de distribution de réfrigérant (CDU) : Les fabricants améliorent l’efficacité grâce à des designs de plaques froides plus optimisés. Les CDU latérales actuelles peuvent dissiper entre 60 kW et 80 kW, mais les développements futurs promettent de doubler ou tripler cette capacité.
- Systèmes de refroidissement liquide en rangée : Les designs avancés dépassent déjà une performance de 1,3 MW, avec des améliorations supplémentaires prévues à mesure que les besoins en puissance de calcul augmentent.
Projection de la chaîne d’approvisionnement
Malgré ces défis, TrendForce affirme que la production de puces GPU Blackwell progresse selon le plan prévu, bien que les expéditions du 4T24 seront limitées. La production augmentera graduellement à partir du 1T25, mais en raison des ajustements dans la chaîne d’approvisionnement des systèmes serveurs IA, les expéditions de fin d’année ne répondront pas aux attentes du secteur.
On prévoit que la chaîne d’approvisionnement sera optimisée à la mi-2025, ce qui permettra d’atteindre le pic des expéditions entre le deuxième et troisième trimestre de l’année.
Conclusion
Le GB200 de NVIDIA représente une avancée significative dans la technologie des serveurs pour IA et HPC, mais son déploiement pose des défis uniques en termes de puissance et de refroidissement. L’adoption généralisée du refroidissement liquide et les améliorations dans la chaîne d’approvisionnement seront essentielles pour répondre à la demande du marché. Les expéditions massives ne se matérialiseront pas avant la seconde moitié de 2025, alors que les fabricants optimisent les capacités d’infrastructure nécessaires pour supporter ces solutions innovantes de NVIDIA.