
NVIDIA Rubin CPX : le GPU qui redéfinit l’inférence de contexte longue à l’ère de l’IA
L’inférence est devient le nouveau champ de bataille de l’intelligence artificielle. Les modèles actuels ne se contentent plus d’être de simples générateurs de texte ou d’images : ils évoluent vers des systèmes agéntiques capables de raisonner sur plusieurs étapes, de maintenir une mémoire persistante et de gérer des contextes de plusieurs millions de tokens. Pour répondre à ce défi, NVIDIA a présenté Rubin CPX, un GPU conçu spécifiquement pour accélérer les charges de travail à contexte massif avec des performances et une efficacité accrues. Le défi de l’inférence à grande échelle Alors que l’IA s’intègre dans davantage de secteurs, les exigences évoluent. Dans le développement logiciel, par exemple, les copilotes de programmation doivent analyser des référentiels entiers, les dépendances entre