Dell Technologies a étendu sa stratégie d’intelligence artificielle d’entreprise avec une proposition très concrète : exécuter des agents d’IA à proximité des données, directement sur des équipements locaux et stations de travail, avant de les transférer vers le centre de données. La société a présenté Dell Deskside Agentic AI, une nouvelle composante de Dell AI Factory with NVIDIA, conçue pour les entreprises souhaitant passer de phases de test d’agents IA à des environnements de production, avec un meilleur contrôle des coûts, de la latence et de la souveraineté des données.
Cette annonce intervient lors du Dell Technologies World 2026, organisé à Las Vegas, et repose sur une tendance montante en entreprise : tout ne doit pas forcément s’exécuter dans des API cloud. Les agents d’IA, capables de travailler de manière autonome sur des tâches complexes, peuvent entraîner une consommation importante de tokens lorsqu’ils sont utilisés à grande échelle. Bien que les prix par token tendent à diminuer, l’utilisation cumulative peut rendre la prévision des coûts difficile, particulièrement dans des flux internes en fonctionnement continu.
IA agéntique en local : réduire la dépendance au cloud
Dell propose Deskside Agentic AI comme une alternative pour les groupes de travail qui ont besoin de tester, déployer et faire évoluer des agents sans transmettre toutes les données vers le cloud public. La solution combine des stations de travail haut de gamme Dell, du matériel NVIDIA et une couche logicielle conçue pour créer et gérer des agents en environnement local.
La société affirme que certaines organisations peuvent atteindre le point d’équilibre en seulement trois mois, en évitant ou en réduisant significativement les coûts liés aux API cloud publiques, avec une économie pouvant atteindre 87 % sur deux ans, selon ses calculs. Il s’agit toutefois d’estimations commerciales, non d’une garantie universelle : ces chiffres dépendront du volume de prédictions, du modèle utilisé, du coût de l’énergie, des frais de gestion et de la durée de vie réelle de l’infrastructure.
Ce mouvement prend tout son sens dans des secteurs où l’IA doit traiter des données sensibles : finance, secteur public, industrie, santé ou défense. Dans ces domaines, il n’est pas toujours possible d’envoyer des informations à des services externes sans respecter la résidence des données, la conformité réglementaire, la traçabilité ou la protection de la propriété intellectuelle. Dans ces cas, déplacer une partie des inférences vers un poste de travail avancé ou le centre de données propre peut s’avérer plus attractif que de dépendre entièrement d’une architecture cloud.
Dell résume cette approche avec une phrase de Jeff Clarke, Directeur des opérations : “le token le plus efficace est celui qui se produit le plus près du donné.” Au-delà du message commercial, cette idée reflète un débat clé dans l’IA d’entreprise : quels traitements doivent rester en local, lesquels peuvent bénéficier du cloud, et quand la combinaison des deux approches devient pertinente.
Du poste de travail au centre de données
La nouvelle offre couvre plusieurs configurations de déploiement. Dell Pro Max avec GB10 cible le prototypage individuel et les petits modèles allant jusqu’à 200 milliards de paramètres. Dell Pro Precision 9 s’adresse aux stations de travail d’entreprise équipées de processeurs Intel Xeon 600 et jusqu’à cinq GPU NVIDIA RTX PRO Blackwell Workstation Edition, aptes à gérer des modèles de 30 000 à 500 000 milliards de paramètres. Enfin, la configuration la plus haut de gamme, Dell Pro Max avec GB300, basée sur le NVIDIA GB300 Grace Blackwell Ultra Desktop Superchip, est conçue pour l’inférence de modèles allant de 120 milliards jusqu’à un billion de paramètres.
| Plateforme | Usage prévu | Range de modèles cité par Dell |
|---|---|---|
| Dell Pro Max with GB10 | Prototypage individuel et petits équipements | 30.000 à 200.000 millions de paramètres |
| Dell Pro Precision 9 | Stations de travail professionnelles avec GPU | 30.000 à 500.000 millions de paramètres |
| Dell Pro Max with GB300 | Inférence avancée en local | 120.000 millions à 1 billion de paramètres |
L’objectif n’est pas de remplacer le centre de données, mais de créer une continuité entre le poste technique, l’équipement départemental et l’infrastructure d’entreprise. Une organisation peut commencer par des agents locaux pour la programmation, l’analyse documentaire, le support interne ou la recherche, puis faire migrer les processus plus matures vers des serveurs Dell PowerEdge XE dans leur propre infrastructure.
Cette démarche s’inscrit dans l’évolution de l’IA agéntique. Après une première phase où beaucoup d’entreprises ont expérimenté chatbots et assistants connectés à des API externes, la étape suivante requiert une intégration plus poussée avec les processus internes, les référentiels documentaires, les systèmes métiers et les politiques de sécurité. Là encore, le matériel joue un rôle central : il ne s’agit pas seulement par nostalgie du on-premise, mais parce que certains coûts et risques deviennent critiques dès que l’usage quitte le mode expérimental.
OpenShell, NemoClaw et AI-Q 2.0
Une des pièces maîtresses de cette annonce est la prise en charge de NVIDIA OpenShell dans toute la gamme Dell AI Factory with NVIDIA. Selon Dell, OpenShell offre un environnement sécurisé et isolé pour créer, déployer et gérer des agents, avec des contrôles de confidentialité et de sécurité en temps réel. La compatibilité couvre aussi bien les stations de travail que les serveurs PowerEdge XE, sous Ubuntu Canonical ou Red Hat AI.
La proposition inclut également NVIDIA NemoClaw, une pile open source de gestion d’agents IA actifs en permanence sur du hardware local. Elle repose sur OpenClaw, un cadre agéntique utilisé pour des flux persistants, autonomes et multi-étapes, et intègre des modèles ouverts NVIDIA Nemotron pour le raisonnement et la programmation.
De plus, Dell annonce le support de NVIDIA AI-Q 2.0, visant à gérer des flux multi-agents pour la recherche, le support à la décision ou des tâches complexes. L’architecture Dell-NVIDIA AI-Q 2.0 Reference Architecture, basée sur Dell AI Data Platform, cible les déploiements on-premise exigeants, notamment dans des secteurs réglementés comme la finance, le secteur public ou la fabrication.
La disponibilité est immédiate pour les composants déjà présentés : Dell Deskside Agentic AI, NVIDIA OpenShell compatible avec Dell AI Factory avec NVIDIA, NVIDIA AI-Q 2.0 et l’architecture de référence Dell-NVIDIA AI-Q 2.0 sont déjà opérationnels.
Pour Dell, le message est clair : l’IA agéntique ne peut pas dépendre uniquement de grands clusters distants ou d’API externes. Pour de nombreuses entreprises, une approche hybride sera privilégiée, avec une inférence locale sur des équipements avancés, des serveurs d’entreprise pour la montée en charge et le cloud lorsque cela s’avère économiquement ou techniquement pertinent. Pour les départements TI, la question ne sera plus seulement quel modèle utiliser, mais où l’exécuter, sous quel contrôle, et avec quels coûts opérationnels à moyen terme.
Questions fréquentes
Qu’est-ce que Dell Deskside Agentic AI ?
C’est une solution de Dell dans le cadre de Dell AI Factory with NVIDIA pour exécuter des flux d’IA agéntique sur des équipements locaux et stations de travail, avec la possibilité de migration vers le centre de données ultérieurement.
Pourquoi Dell insiste-t-il sur l’exécution des agents d’IA près des données ?
Parce que les agents peuvent consommer beaucoup de tokens et traiter des informations sensibles. Les exécuter en local permet de réduire la latence, d’améliorer le contrôle des données et d’assurer une meilleure prévisibilité des coûts, selon la charge.
Cette solution remplace-t-elle le cloud public ?
Non. Dell prône un modèle hybride. Certaines tâches seront exécutées sur des stations ou serveurs internes, d’autres continueront à bénéficier du cloud selon leur intérêt technique ou économique.
Quel rôle joue NVIDIA dans cette annonce ?
NVIDIA fournit le matériel, les modèles et logiciels comme OpenShell, NemoClaw et AI-Q 2.0, que Dell intègre dans sa Dell AI Factory pour créer, déployer et gouverner les agents depuis le poste de travail jusqu’au centre de données.