Dell et NVIDIA font de l’IA d’entreprise un produit de rack

Dell annonce des milliers de licenciements massifs dans ses divisions de vente et de marketing.

Michael Dell et Jensen Huang ont partagé la scène à Las Vegas pour délivrer un message qui va bien au-delà de l’annonce de nouveaux serveurs. La proposition de Dell Technologies est claire : l’IA privée passe de projet complexe et coûteux à catégorie d’infrastructure accessible, déployable rapidement et gérable simplement, au sein même du datacenter d’entreprise.

Le chiffre qui retient l’attention est celui de l’économie estimée. Dell affirme que, pour certaines charges d’IA agéntique, ses solutions Deskside Agentic AI peuvent réduire les coûts jusqu’à 87 % comparé aux API cloud publiques sur deux ans, avec un point d’équilibre atteignable en trois mois. Ce sont des estimations commerciales qui dépendent du cas d’usage, du modèle, de la consommation énergétique et de l’amortissement matériel, mais elles reflètent une tendance de fond : toutes les charges IA ne sont pas rentables en consommation variable sur le cloud public.

De projet expérimental à usine IA entièrement packagée

Pendant des années, exécuter de l’IA en local semblait réservé aux laboratoires ou aux grandes équipes d’infrastructure. Le choix impliquait de gérer serveurs, GPU, stockage, réseaux, logiciels, modèles, sécurité, opération et support. Beaucoup d’entreprises préféraient les API externes, rapides à tester et sans investissement initial.

Cet équilibre change. L’explosion des agents IA altère l’économie. Un chatbot répondant à quelques questions peut fonctionner sous un modèle de paiement à l’usage. En revanche, un ensemble d’agents qui consultent des documents internes, exécutent du code, appellent des API, travaillent avec des bases de données et génèrent des milliers d’interactions quotidiennes peut faire décoller les coûts et poser des questions sur la sécurité, la confidentialité et la gouvernance des données.

Dell répond à ces défis avec une solution complète, des stations de travail aux racks datacenter. Dell Deskside Agentic AI combine des postes haute performance, des accélérateurs NVIDIA, des modèles open source, NVIDIA NemoClaw et OpenShell pour créer et exécuter des agents proches des utilisateurs. Côté datacenter, Dell AI Factory avec NVIDIA regroupe serveurs PowerEdge, stockage, réseaux, logiciels, services et architectures de référence.

Ce qui change par rapport aux étapes précédentes, c’est la façon d’acheter. Un DSI n’a plus à concevoir l’IA privée comme un assemblage de composants disparates. Il peut opter pour une « usine IA » validée Dell/NVIDIA, avec des configurations spécifiques pour le développement, l’inférence, les agents, les données d’entreprise et la scalabilité future. La complexité ne disparaît pas, mais elle est mieux packagée.

L’économie par token redessine le dialogue

Le coût par token est devenu une métrique clé en entreprise. Chaque requête à un modèle, chaque résumé, appel d’agent, exécution de code ou recherche de contexte consomme des tokens. Quand l’usage est limité ou imprévisible, les API cloud restent pratiques. Quand la charge devient intensive, répétitive et liée à des données internes, une infrastructure propre commence à faire sens.

Si une entreprise sait que ses agents travailleront chaque jour sur de la documentation, des tickets, des données opérationnelles ou des flux de travail internes, payer chaque interaction comme une consommation externe peut s’avérer moins attractif. Rapatrier l’inférence en environnement privé offre plus de contrôle sur la latence, la confidentialité, la résidence des données et l’accès aux systèmes critiques.

Élément annoncé par Dell/NVIDIACe qu’il apporte
Dell Deskside Agentic AIAgents IA sur stations locales pour les équipes métier et développement
Jusqu’à 87 % d’économies vs API cloudEstimation Dell pour certaines charges agéntiques sur deux ans
Point d’équilibre en trois moisComparaison de coûts Dell vs API cloud publiques
PowerEdge avec NVIDIA Blackwell UltraInfrastructure haute performance pour entraînement et inférence
Jusqu’à 256 GPU Blackwell Ultra par rackConfigurations Dell IR7000 avec refroidissement liquide
4x plus rapide en entraînement LLMComparaison annoncée par Dell vs générations précédentes
NVIDIA OpenShellEnvironnement ouvert pour agents avec contrôles sécurité et confidentialité
NVIDIA NemoClawStack de référence pour agents autonomes et persistants

Le matériel reste un élément fondamental. Dell a élargi son AI Factory avec des serveurs PowerEdge basés sur NVIDIA Blackwell Ultra, configurés avec jusqu’à 192 GPU par système et jusqu’à 256 GPU par rack Dell IR7000. La société annonce des gains de performance jusqu’à 4x en entraînement de grands modèles par rapport aux générations précédentes, ce qui exige un refroidissement liquide direct, des réseaux haute vitesse et une architecture de racks plus intégrée. Le contexte global de ce marché est analysé dans notre article sur le marché GPU pour datacenters.

Open source, agents et maîtrise des données

La dynamique compétitive évolue aussi. Il y a deux ans, beaucoup d’entreprises considéraient que les meilleurs résultats ne venaient que de modèles fermés consommés via API. Les modèles ouverts ont depuis progressé suffisamment pour couvrir de nombreux cas d’usage d’entreprise, surtout quand ils sont ajustés avec des données propres, combinés avec des techniques RAG, exécutés dans des flux contrôlés ou intégrés à des systèmes internes.

Une organisation peut utiliser des API externes pour les tâches très avancées et, en même temps, exécuter des modèles open source localement pour le support interne, la recherche documentaire, les classifications, les automatisations ou les agents spécialisés. Ce n’est pas un choix binaire.

NVIDIA et Dell veulent occuper cet espace intermédiaire. Ils ne vendent pas seulement des serveurs ; ils proposent une infrastructure où modèles, données et agents peuvent opérer sous contrôle d’entreprise. OpenShell fournit un environnement d’exécution avec des contrôles de sécurité et de confidentialité. NemoClaw et Nemotron offrent une base pour construire des agents et des modèles personnalisés. La plateforme Dell AI Data connecte cette couche aux données internes de l’entreprise. Les résultats financiers récents de NVIDIA montrent d’ailleurs que cette stratégie porte ses fruits : 75,2 Md$ générés par les centres de données au Q1 FY2027, comme détaillé dans notre analyse sur la stratégie matérielle de NVIDIA.

Pour les secteurs réglementés, cette proposition est particulièrement convaincante. Banque, santé, industrie, administration publique, défense et services professionnels ne peuvent pas toujours envoyer des données sensibles vers des API externes sans vérifier la conformité, la juridiction, la propriété intellectuelle et la traçabilité. L’IA privée est une alternative viable, à condition que l’organisation ait la capacité de l’opérer de manière sécurisée.

La notion d' »on-premise » évolue. Elle n’est plus perçue comme un retour en arrière ou un rejet du cloud. Le scénario le plus probable sera hybride : cloud public pour la flexibilité, l’expérimentation et certains modèles frontières ; infrastructure privée pour les données sensibles, les agents persistants et les charges à coûts prévisibles ; edge ou stations de travail pour les équipes nécessitant une faible latence ou un traitement proche des données.

La vraie compétition ne se jouera pas uniquement sur qui possède le modèle le plus puissant, mais sur qui fait fonctionner l’IA dans l’organisation avec des coûts soutenables, des données protégées et des agents qui agissent sans briser les contrôles internes. Dell et NVIDIA veulent que cette solution se vende presque comme une mise à jour d’infrastructure. Si c’est réussi, l’IA privée cessera d’être une exception pour devenir une option de marché réelle.

Questions fréquentes sur Dell AI Factory et l’IA privée

Qu’a annoncé Dell avec NVIDIA ?

Dell a renforcé sa plateforme AI Factory avec NVIDIA en ajoutant des solutions pour l’IA agéntique, des stations de travail locales, des serveurs PowerEdge avec Blackwell Ultra, des logiciels d’agents et des architectures pour déployer l’IA privée du bureau jusqu’au datacenter.

L’économie de 87 % vs les API cloud est-elle réaliste ?

C’est une estimation Dell pour des charges spécifiques d’IA agéntique sur deux ans. L’économie peut être significative pour les usages intensifs et continus, mais elle dépend du volume, du modèle, de la consommation énergétique, du support et de l’amortissement matériel.

Que signifie avoir l’IA privée dans un rack ?

Que certaines entreprises peuvent gérer leurs modèles et agents sur leur propre infrastructure, avec des serveurs, GPU, réseaux, stockage et logiciels validés, sans dépendre exclusivement des API externes.

L’IA privée va-t-elle remplacer le cloud public ?

Pas dans tous les cas. La tendance la plus probable est un fonctionnement hybride : cloud public pour la flexibilité et certains modèles frontières ; infrastructure privée pour les données sensibles, les charges à coûts prévisibles et les agents intégrés aux systèmes internes.

le dernier