NVIDIA DSX transforme l’usine d’IA en un système complet

NVIDIA DSX transforme l'usine d'IA en un système complet

NVIDIA a présenté DSX, une nouvelle plateforme conçue pour aider les opérateurs, fabricants et intégrateurs à construire et exploiter des « usines d’IA » avec une approche plus proche de l’ingénierie industrielle que du déploiement classique de serveurs. Annoncée lors du GTC Taipei, cette initiative illustre l’ambition de la société d’étendre son rôle dans l’infrastructure de l’intelligence artificielle : il ne s’agit plus seulement de vendre des puces, mais de définir comment concevoir, simuler, alimenter, refroidir et gérer les centres de données supportant les modèles de prochaine génération.

L’idée centrale de DSX est de fournir un manuel complet pour la construction d’infrastructures IA à grande échelle. NVIDIA combine pour cela des designs de référence, un logiciel open source, des API, de la simulation, une gestion opérationnelle, des technologies de refroidissement, une intégration énergétique et un écosystème de partenaires industriels. Selon Jensen Huang, la société ne souhaite pas se limiter à « envoyer des puces », mais offrir aux bâtisseurs d’infrastructure un cadre pour simuler l’ensemble de la fabrique avant investissement, valider la performance avant l’installation des racks et exploiter avec la fiabilité exigée en production d’IA.

Le coût par token devient la nouvelle métrique

La métrique que NVIDIA veut mettre au centre du débat est le coût par token. Jusqu’à présent, une grande partie de la discussion sur l’IA se mesurait en GPU, paramètres, FLOPS, racks ou mégawatts. DSX tente d’orienter la réflexion vers une question plus opérationnelle : combien de tokens une installation peut-elle générer ou traiter par megawatt disponible, et à quel coût ?

C’est là qu’intervient DSX MaxLPS, un nouvel ensemble de technologies visant à optimiser le rendement en tokens par mégawatt dans le cadre d’un budget énergétique fixe. Selon NVIDIA, cette couche associe refroidissement liquide à 45 °C et technologies intégrées dans le rack permettant d’utiliser jusqu’à 40 % de GPU supplémentaires en pointe de performance énergétique, avec un impact minimal sur le rendement des charges.

Ce paramètre est crucial car l’IA atteint désormais ses limites physiques. Les opérateurs doivent non seulement acquérir davantage d’accélérateurs, mais aussi assurer une puissance électrique suffisante, des capacités de connexion réseau, un refroidissement efficace, de l’espace, un personnel qualifié et une disponibilité constante. Dans de nombreux marchés, le goulot d’étranglement n’est pas uniquement le chip, mais aussi le mégawatt. Si une plateforme peut tirer davantage de puissance utile depuis la même limite électrique, l’impact économique peut être considérable.

DSX inclut également DSX OS, un logiciel modulaire open source conçu pour la gestion des opérations d’une usine d’IA. La plateforme couvre la gestion du cycle de vie, la planification intelligente, la cohérence en temps réel, l’automatisation de la santé du système, la résilience, l’exploitation multi-locataires et les services de plateforme. L’objectif est que l’infrastructure IA soit gérée comme un environnement vivant où matériel, logiciel, énergie, réseau et refroidissement interagissent de manière coordonnée.

Simuler avant de construire

Une des pièces maîtresses de DSX est DSX Sim, une couche de simulation haute fidélité permettant de modéliser les décisions d’infrastructure depuis la phase de planification jusqu’à l’exploitation. NVIDIA souhaite que ses clients et partenaires puissent valider leurs designs avant de déployer des racks physiques, ce qui devient crucial lorsque chaque erreur en matière de puissance, refroidissement ou distribution peut coûter des millions.

La plateforme s’enrichit avec DSX Reference Design, qui propose des architectures validées par génération pour le calcul, les réseaux, le stockage, la conception des clusters, l’alimentation, le refroidissement, les contrôles et les éléments civils, structurels et architecturaux. Cela permet de standardiser le déploiement des usines d’IA sans imposer à chaque opérateur de tout réinventer depuis le départ.

DSX Flex apporte une dimension supplémentaire : l’intégration avec les services du réseau électrique. Cette couche permet d’adapter dynamiquement la charge IA en réponse à des signaux externes tels que la réduction de charge, la réponse à la demande, des événements de prix ou la disponibilité des énergies renouvelables et du stockage. Dans un contexte où la demande en centres de données commence à faire pression sur les réseaux électriques locaux, la capacité d’une usine d’IA à se comporter de façon flexible peut faire la différence pour obtenir ou non une nouvelle puissance.

NVIDIA inclut également DSX Exchange, dédié à l’intégration des signaux de calcul, réseau, énergie, puissance et refroidissement entre IT, opérations et gestion. Cette étape est essentielle car les centres de données IA ne peuvent plus être gérés en silos séparés. Les informations provenant des racks, clusters, stations électriques, systèmes de refroidissement et réseaux doivent être partagées pour optimiser la performance et la disponibilité.

Un écosystème qui renforce la position de NVIDIA

DSX s’appuie sur un vaste réseau de partenaires. Des fabricants tels que Dell Technologies, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology, Wistron et Wiwynn développent des systèmes compatibles DSX. Par ailleurs, des fournisseurs cloud comme CoreWeave, Crusoe, Firmus, IREN, Lambda, Nebius, Nscale et Yotta Data Services déploient des composants pour réduire les risques, optimiser l’utilisation des GPU et accélérer le déploiement de capacités IA.

Cette liste reflète l’ambition de NVIDIA. DSX n’est pas une simple plateforme interne ni un ensemble de bonnes pratiques, mais une stratégie pour organiser tout un écosystème autour de son architecture. En produisant des systèmes « compatibles DSX » et en adoptant DSX Sim, DSX MaxLPS et DSX OS, NVIDIA exerce une influence majeure sur la conception globale de l’infrastructure, du chip à l’installation.

Le partenariat avec des éditeurs de logiciels industriels se renforce également. QCT et Pegatron collaborent avec Dassault Systèmes pour un configurateur de jumeau numérique destiné aux usines d’IA, tandis que l’écosystème Omniverse DSX Blueprint s’intègre à des acteurs comme Cadence, PTC et Siemens. Ce lien entre simulation, ingénierie système et déploiement physique confirme que l’IA n’est plus simplement un logiciel : c’est une véritable industrie d’infrastructure lourde.

DSX Flex est également en phase de test dans un pilote commercial multi-mégawatts avec Emerald AI et Silicon Valley Power, visant à démontrer la capacité de réglage de consommation en réponse aux signaux électriques sans compromettre la performance. Si cette approche parvenait à s’étendre, elle pourrait faciliter l’intégration de nouveaux centres en répondant aux contraintes croissantes des réseaux électriques.

L’usine d’IA comme produit

L’approche stratégique est claire : NVIDIA souhaite faire de la fabrique d’IA un produit complet, plutôt qu’une simple somme de composants achetés à divers fournisseurs. Cela présente des avantages pour ses clients : moins de risques d’intégration, des designs plus éprouvés, une meilleure simulation, une visibilité accrue sur l’exploitation et une feuille de route plus claire pour déployer à grande échelle.

Mais cette stratégie accroît également la dépendance à l’écosystème NVIDIA. Plus les designs de référence, le logiciel, les outils de simulation et les plateformes de gestion énergétique seront adoptés, plus il sera difficile de dissocier l’infrastructure IA de l’architecture NVIDIA. Pour certains opérateurs, cette intégration représente un avantage, en accélérant les déploiements, mais pour d’autres, elle soulèvera des questions sur le verrouillage, l’interopérabilité et le contrôle à long terme.

Ce mouvement intervient à un moment où le secteur cherche à passer d’une phase d’achat frénétique de GPUs à une phase plus mature d’exploitation. Les grands clients ne veulent plus uniquement des clusters rapides ; ils recherchent une capacité stable, efficace, reproductible et mesurable. Le coût par token, la disponibilité, la consommation par mégawatt et la rapidité de déploiement deviendront des métriques aussi importantes que le nombre d’accélérateurs installés.

NVIDIA DSX répond précisément à cette transformation. La société indique au marché que l’avantage compétitif en IA ne reposera pas seulement sur la puissance du chip, mais sur la conception de toute l’usine, pour convertir l’énergie en intelligence avec un coût minimal. Dans un monde où les mégawatts sont rares et où la demande en IA ne faiblit pas, cette nouvelle frontière de l’infrastructure numérique pourrait devenir stratégique.

Questions fréquemment posées

Qu’est-ce que NVIDIA DSX ?
NVIDIA DSX est une plateforme pour concevoir, simuler, déployer et exploiter des usines d’IA. Elle comprend des logiciels, des API, des designs de référence, de la simulation, une gestion opérationnelle et des technologies de partenaires industriels.

Qu’est-ce que DSX MaxLPS ?
C’est un ensemble de technologies visant à maximiser le rendement en tokens par mégawatt. NVIDIA affirme qu’il permet d’utiliser jusqu’à 40 % de GPU supplémentaires en phase de pointe, avec une efficacité énergétique améliorée.

Que propose DSX OS ?
DSX OS est un logiciel modulaire open source destiné à gérer les opérations d’une usine d’IA, avec des fonctions pour le cycle de vie, la résilience, la santé du système, le multi-locataires et les services de plateforme.

Pourquoi le coût par token est-il important ?
Parce qu’il mesure l’efficacité réelle d’une infrastructure IA. Avoir de nombreux GPU ne suffit pas : il faut connaître la capacité à produire des tokens par mégawatt et le coût associé.

le dernier