Jensen Huang a encore une fois utilisé une image puissante pour illustrer le moment actuel de l’intelligence artificielle d’entreprise. Lors de Dell Technologies World, le PDG de NVIDIA a affirmé que la demande « a pris une trajectoire parabole », résumé qui reflète la transition de Dell et NVIDIA : l’IA ne se limite plus aux phases de test, mais passe à des déploiements concrets, avec des agents autonomes, de l’inférence à grande échelle et des modèles en cours d’exécution directement au sein des entreprises.
Le message est clair. Les entreprises ont quitté l’expérimentation avec des chatbots et des pilotes isolés pour se demander comment intégrer des agents d’IA dans leurs processus internes, bases de données, code, documentation, opérations industrielles et flux de travail sensibles. Un débat majeur se profile alors : quelle partie de cette IA doit être déployée dans le cloud public et quelle partie est préférable de conserver sur des infrastructures propres, qu’elles soient sur site, en colocation, en edge ou sur des stations de travail avancées ?
Dell AI Factory with NVIDIA : du pilote à la production
La keynote de Michael Dell et Jensen Huang a porté sur Dell AI Factory with NVIDIA, une solution combinant serveurs, réseaux, stockage, logiciels, services et modèles pour un déploiement d’IA d’entreprise de bout en bout. NVIDIA décrit cette plateforme comme dédiée aux agents autonomes, allant de stations de travail « deskside » jusqu’à des racks complets en datacenter. Dell insiste quant à lui sur le fait que l’IA d’entreprise nécessite sécurité, gouvernance et coûts plus prévisibles que ceux d’une stratégie basée uniquement sur des API cloud.
Les chiffres présentés illustrent l’ampleur de cet enjeu. Selon Dell, la dépense mondiale en infrastructure IA pourrait atteindre entre 3 et 4 trillions de dollars d’ici 2030, avec une croissance du volume de tokens consommés pouvant atteindre 3 400 %. Bien que ces prévisions soient aidées par les intérêts des acteurs impliqués, elles pointent déjà vers une réalité tangible : lorsque l’IA passe de la démo à la production, le coût de l’inférence, la disponibilité des données et l’efficacité de l’infrastructure deviennent tout aussi cruciaux que le choix du modèle.
| Information annoncée par Dell et NVIDIA | Chiffre |
|---|---|
| Entreprises utilisant des charges IA dans Dell AI Factories with NVIDIA | 5 000 |
| Dépense mondiale estimée en infrastructure IA jusqu’en 2030 | 3-4 trillions de dollars |
| Croissance prévue de la consommation de tokens jusqu’en 2030 | 3 400 % |
| Pourcentage de charges IA déjà exécutées en dehors du cloud, selon une enquête Dell | 67 % |
| Entreprises disposant d’au moins une charge IA on-premise | 88 % |
| Économies potentielles avec Dell Deskside Agentic AI par rapport aux API cloud en deux ans | jusqu’à 87 % |
| Punto d’équilibre estimé par rapport aux API cloud publiques | dès 3 mois |
Il convient cependant de prendre ces chiffres avec prudence. L’économie réalisée par rapport au cloud dépendra du volume d’utilisation, du type de modèle, de la consommation d’énergie, de la compétence technique, de l’amortissement du matériel et des besoins en disponibilité. Néanmoins, l’argument commence à devenir familier pour de nombreuses entreprises : si les agents IA consultent en permanence des données internes, exécutent du code, manipulent des documents confidentiels et génèrent des tokens sur des heures, le modèle purement cloud peut devenir difficile à contrôler.
Vera Rubin, PowerEdge et la guerre du coût par token
Le point le plus stratégique de l’annonce réside dans la nouvelle génération d’infrastructures accélérées. Dell a présenté le PowerEdge XE9812 basé sur NVIDIA Vera Rubin NVL72, une plateforme qui, selon NVIDIA, permettra de réduire jusqu’à 10 fois le coût par token par rapport à Blackwell dans l’inférence à grande échelle. S’y ajoutent les serveurs PowerEdge XE9880L, XE9885L et XE9882L, équipés de NVIDIA HGX Rubin NVL8, avec support jusqu’à 144 GPU par rack et des nœuds de calcul refroidis par liquide en immersion directe.
Le focus ne se limite plus à entraîner des modèles de plus en plus volumineux. La nouvelle bataille concerne la fourniture massive, bon marché et stable d’inférences. Les agents IA ne répondent pas à une unique question puis s’arrêtent, mais peuvent consulter des outils, diviser des tâches, générer et vérifier du code, accéder à des bases de données, récupérer des documents, valider des réponses et répéter ces étapes. Cela multiplie la consommation de tokens et exerce une pression accrue sur le CPU, le GPU, la mémoire, le réseau et le stockage.
NVIDIA Vera, le CPU conçu pour ce type de charges, occupe également une place clef. Dell intégrera Vera dans ses serveurs PowerEdge M9822 et R9822. Selon NVIDIA, Vera offre une bande passante mémoire de 1,2 To/s et augmente la vitesse des charges agents de 50 % par rapport aux processeurs x86 traditionnels dans les scénarios évoqués. De plus, une amélioration pouvant atteindre 3 fois en requêtes analytiques avec Starburst utilisant Vera pour SQL à grande échelle est mentionnée.
| Produit ou technologie | Rôle dans la stratégie |
|---|---|
| Dell PowerEdge XE9812 avec NVIDIA Vera Rubin NVL72 | Inférence à grande échelle et réduction du coût par token |
| PowerEdge XE9880L, XE9885L et XE9882L avec HGX Rubin NVL8 | Serveurs refroidis par liquide pour haute densité de GPU |
| NVIDIA Vera CPU | Charges séquentielles d’agents, analytique, pipelines de données et sandboxes |
| Red Dell PowerSwitch avec Quantum-X800 et Spectrum-6 | Réseau haute performance pour clusters IA |
| Dell PowerRack | Système intégré de calcul, réseau et stockage pour IA et HPC |
| Dell AI Data Platform avec NVIDIA | Préparation, recherche, analytique et gestion des données d’entreprise avec modèles |
Le rack aussi gagne en importance. Le Dell PowerRack se présente comme un système intégrée où calcul, réseau, stockage, refroidissement, gestion énergétique et logiciels sont conçus comme un tout cohérent. La leçon est claire : en IA à grande échelle, il ne suffit pas d’acheter des GPU. La performance réelle dépend aussi du réseau, du refroidissement liquide, de l’alimentation électrique, du stockage et de l’intégration opérationnelle.
Agents locaux, données sécurisées et modèles sous contrôle
Une des idées récurrentes lors de l’événement est la nécessité de rapprocher l’IA des données. Dell Deskside Agentic AI permet le déploiement d’agents d’IA sur stations de travail locales équipées de NVIDIA NemoClaw, NVIDIA OpenShell et modèles Nemotron, en complément de postes Dell Pro Max avec GB10 et GB300, et stations Dell Pro Precision dotées de GPU RTX PRO Blackwell. La gamme couvre des modèles allant de 30 milliards à 1 trillion de paramètres, selon la configuration.
Cette approche a du sens pour des départements d’ingénierie, de recherche, de design, de finance, pour le secteur public ou encore dans des industries fortement réglementées. Un agent travaillant avec du code source, de la propriété intellectuelle, des données de santé, de la documentation légale ou des informations industrielles ne peut pas toujours dépendre d’une API externe. En réponse, Dell et NVIDIA proposent d’exécuter ces agents localement, en testant près des données, avant éventuellement de monter en puissance vers le datacenter d’entreprise si le cas d’usage devient stable et mature.
La sécurité s’appuie sur NVIDIA OpenShell, un runtime open source destiné à développer et déployer des agents avec contrôles de confidentialité et politiques d’entreprise. NVIDIA Confidential Computing, que Dell relie à des partenaires comme Fortanix, Google et Red Hat, assure la protection des modèles et des données en cours d’utilisation. L’objectif est de permettre le déploiement de modèles avancés au sein du périmètre de l’entreprise, sans exposer les poids du modèle ni les informations sensibles.
Le catalogue de modèles et partenaires s’étoffe également. NVIDIA évoque Nemotron comme une option de modèles ouverts permettant aux entreprises d’ajuster les poids à leurs domaines spécifiques. Dell et NVIDIA mentionnent aussi Reflection, MiniMax, DeepSeek, GLM, Kimi, Mistral, Gemma et d’autres modèles accessibles via Dell Enterprise Hub sur Hugging Face. OpenAI Codex se connectera à la Dell AI Data Platform pour accéder au contexte interne des entreprises, comme les bases de codes, la documentation et l’écosystème métier.
Le message aux responsables IT et aux CIO est clair : l’IA agentique ne se limitera pas à une simple application SaaS. Dans de nombreux cas, elle nécessitera une architecture propre, avec des données gouvernées, des modèles autorisés, des logs d’activités, un isolement d’exécution, une protection des secrets et un réseau capable de soutenir des flux intensifs entre agents, outils et systèmes internes.
Il existe également une dimension économique. Si ces agents génèrent de plus en plus de tokens et effectuent davantage de tâches en arrière-plan, le coût variable des API pourrait devenir difficile à prévoir. Se doter d’une infrastructure propre n’est pas toujours moins coûteux, mais offre plus de contrôle lorsque l’usage devient régulier, intensif ou sensible. Pour des charges sporadiques, le cloud reste une solution raisonnable. Mais pour des agents travaillant quotidiennement avec des données d’entreprise, la donne commence à changer.
Ce partenariat entre Dell et NVIDIA illustre la voie d’avenir : moins de discours abstrait sur « utiliser l’IA » et davantage de discussions concrètes sur les racks, la refroidissement liquide, les CPU spécialisés, la gestion des données internes, la sécurité, le coût par token et les déploiements réels. L’IA d’entreprise entre dans une phase moins spectaculaire mais plus cruciale : celle de transformer les pilotes en systèmes opérationnels au quotidien.
Questions fréquentes
Qu’a annoncé NVIDIA avec Dell lors de Dell Technologies World ?
NVIDIA et Dell ont dévoilé de nouvelles composantes de Dell AI Factory with NVIDIA, incluant des systèmes avec Vera Rubin, des serveurs PowerEdge, Dell PowerRack, Dell Deskside Agentic AI, NVIDIA OpenShell et de nouvelles intégrations avec des modèles et partenaires pour l’entreprise.
Pourquoi Jensen Huang qualifie-t-il la demande d’IA de « parabole » ?
Parce que les entreprises passent d’expérimentations isolées à des inférences et agents IA déployés en production. Cette évolution pousse à une consommation accrue de tokens, une demande en calculs croissante et une pression sur l’infrastructure.
Qu’est-ce que Dell Deskside Agentic AI ?
Une solution permettant de déployer des agents IA directement sur stations de travail locales, utilisant des modèles ouverts, NVIDIA NemoClaw et OpenShell, pour travailler avec des données sensibles sans dépendre exclusivement du cloud.
Le déploiement de l’IA d’entreprise va-t-il quitter le cloud public ?
Pas complètement. Il s’agit d’un scénario hybride : certaines charges continueront dans le cloud, mais les données sensibles, les agents persistants et certains modèles spécifiques pourront fonctionner en local, en colocation, à l’edge ou sur des stations internes.
source : blogs.nvidia