NVIDIA a annoncé la disponibilité générale d’une nouvelle variante de sa GPU professionnelle basée sur Blackwell : la RTX PRO 5000 avec 72 Go de mémoire GDDR7. La simplicité de cette démarche s’inscrit dans un contexte précis : les flux de travail actuels d’IA générative et, surtout, d’IA agentique poussent à leurs limites la mémoire des GPU de bureau, alors que les entreprises souhaitent prototyper et exécuter davantage en local pour des considérations de confidentialité, de latence et de coût.
Jusqu’à présent, la RTX PRO 5000 disposait de 48 Go. Avec cette nouvelle version de 72 Go, NVIDIA offre une gamme élargie à ceux qui ont besoin de plus de capacité de VRAM sans pour autant passer par une infrastructure de centre de données. Concrètement, il s’agit d’un mouvement ciblant les équipes de développement, d’ingénierie et de création, qui ne se contentent plus de rendu ou de simulation : elles exécutent aussi des modèles de langage, des pipelines multimodaux, des systèmes avec RAG et des chaînes d’outils impliquant plusieurs composants en simultané.
L’importance de la mémoire : pourquoi 72 Go sont plus cruciaux qu’il n’y paraît
En IA locale, la puissance brute ne fait pas tout. Pour de nombreuses charges modernes, le goulet d’étranglement se manifeste principalement sous deux aspects :
- Capacité : quels modèles, contextes et datasets peuvent coexister dans la GPU ?
- Throughput : quelle vitesse réelle de génération de texte, d’images ou d’itérations dans un pipeline peut-on atteindre ?
NVIDIA présente cette RTX PRO 5000 de 72 Go comme une réponse directe à cette pression. La donnée clé est claire : 72 Go de GDDR7, soit un 50 % de mémoire en plus par rapport à la version de 48 Go, une capacité adaptée aux workflows plus « gourmands » en mémoire, incluant gros modèles, des contextes prolongés ou encore des pipelines combinant texte, images, vidéos, outils et récupération d’informations.
Dans ce contexte, l’argument de l’IA agentique prend une nuance technique : un agent ne consiste pas simplement en un modèle unique générant du texte. Il s’agit souvent d’orchestration, d’appels à des outils, de récupération de données, de raisonnement avec du contexte, et, en milieu professionnel, d’intégration avec documentation, tickets, dépôts ou données internes. Maitriser tout cela en mémoire (ou éviter les allers-retours constants avec le système) constitue la différence entre un prototype fonctionnel et une solution frustrante.
Blackwell en station de travail : 2 142 TOPS et une promesse de « plus local, moins cloud »
La RTX PRO 5000 72 Go repose sur l’architecture NVIDIA Blackwell, que la société associe à des améliorations en termes de performances pour l’IA, le rendu neuronal et la simulation, ainsi qu’à des fonctionnalités visant à gérer plusieurs charges de travail plus efficacement.
Selon NVIDIA, la nouvelle GPU offre une puissance de 2 142 TOPS pour l’IA. Le message est clair : il s’agit d’une carte capable d’apporter au poste de travail des tâches que, jusqu’ici, se résolvaient souvent par une infrastructure distante — formations légères, fine-tuning, tests rapides, prototypage d’agents, inférence multimodale ou développement d’applications nécessitant une faible latence.
Ce volet « local » s’inscrit aussi dans un discours récurrent en entreprise : vie privée et contrôle des données. En exécutant le modèle en station de travail, de nombreuses équipes peuvent réduire leurs dépendances extérieures pour leurs tâches internes, éviter de transférer des datasets sensibles, et diminuer les coûts liés aux tests répétés dans le cloud.
Performance : comparatifs en IA générative et avancées dans le rendu
Dans les benchmarks d’IA générative, NVIDIA affirme que cette RTX PRO 5000 de 72 Go fournit :
- Jusqu’à 3,5 fois plus de performance que le matériel professionnel de génération précédente en rendu d’images.
- Jusqu’à 2 fois plus de performance en génération de texte, par rapport à la version antérieure.
Et au-delà de l’IA pure, cette GPU mise également sur la création et la visualisation professionnelles. Sur des moteurs de path tracing tels qu’Arnold, Chaos V-Ray ou Blender, ainsi que sur des moteurs GPU temps réel comme D5 Render et Redshift, NVIDIA annonce des réductions de temps pouvant aller jusqu’à 4,7×. Pour l’ingénierie et le design produit, la société évoque un doublement du rendement graphique.
De façon pratique, ce message souligne que cette GPU ne vise pas uniquement à « faire de l’IA », mais à un profil hybride, de plus en plus fréquent : des équipes combinant CAO/FAO, simulation, scènes 3D complexes et outils génératifs (dénoisers, assistants, génération d’actifs, automatisation), où une mémoire supplémentaire se traduit par moins de limites et plus de fluidité dans le processus créatif.
Cas d’adoption précoce : design génératif et itérations en production virtuelle
NVIDIA cite deux exemples illustrant le genre d’usage visé :
- InfinitForm, utilisant la GPU pour optimiser son logiciel de conception générative accélérée par CUDA, destiné à l’ingénierie et la fabrication, afin d’accélérer simulations et flux CAD.
- Versatile Media, spécialisée en production virtuelle, qui cherche à améliorer les performances en rendu en temps réel avec des scènes volumineuses et des actifs complexes, où la mémoire additionnelle permet d’itérer à plus haute résolution et avec plus de détails sans trop pénaliser le workflow créatif.
Disponibilité : via partenaires professionnels et déploiements “à partir de l’année prochaine”
La RTX PRO 5000 72 Go est déjà accessible via des partenaires comme Ingram Micro, Leadtek, Unisplendour et xFusion. NVIDIA annonce aussi une disponibilité plus large à travers des intégrateurs mondiaux « au début de l’année suivante ».
Ce lancement envoie un message clair : la course pour apporter l’IA agentique et multimodale au poste de travail ne concerne pas uniquement les modèles. Elle porte aussi sur la mémoire, la rapidité d’itération et la capacité à faire davantage près de l’utilisateur, sans que chaque test doive mobiliser de ressources en centre de données.
Questions fréquentes
À quoi sert une VRAM de 72 Go dans une station de travail IA ?
Elle permet d’exécuter en local des modèles et des pipelines plus volumineux (LLMs, RAG, multimodal, agents outils) et de gérer des scènes ou datasets lourds sans manquer de mémoire.
Quelles sont les améliorations par rapport à la RTX PRO 5000 de 48 Go ?
La capacité : 72 Go, soit 50 % de mémoire en plus, permettant de faire tourner des modèles plus grands et des contextes plus étendus, tout en gardant plus de composants actifs simultanément.
Quels profils de professionnels en bénéficient le plus ?
Développeurs d’IA, data scientists, équipes d’ingénierie (CAO/FAO) et créateurs 3D/production virtuelle, qui combinent rendu, simulation et outils génératifs.
Quand sera-t-elle disponible chez les intégrateurs mondiaux ?
NVIDIA indique qu’une disponibilité accrue par le biais de system builders débutera au début de l’année prochaine.
source : blogs.nvidia