NVIDIA refroidit Rubin CPX et réorganise sa stratégie d’inférence

NVIDIA semble reconsidérer le rôle de Rubin CPX, l’accélérateur d’inférence présenté en septembre 2025 comme un composant clé de la future plateforme Vera Rubin. Selon des sources industrielles citées par The Elec, la société n’aurait pas passé de commandes ni réalisé de développements liés à la mémoire GDDR7 ni aux substrats nécessaires pour ce produit, […]
Meta accélère MTIA et rejoint la course aux puces d’inférence propriétaires

Meta a décidé d’accélérer le déploiement de sa famille d’accélérateurs propriétaires MTIA, renforçant ainsi une tendance clairement perceptible parmi les géants de l’hyperéchelle : réduire leur dépendance à une seule architecture GPU pour l’inférence en IA. Dans un article technique publié par la société, Meta détaille quatre nouvelles générations de sa ligne Meta Training and […]
Microsoft présente Maia 200 : l’accélérateur d’inférence avec lequel elle veut réduire le coût de la « économie du jeton »

Microsoft a dévoilé Maia 200, son nouvel accélérateur dédié à l’inférence (génération de tokens), conçu pour réduire significativement les coûts et améliorer l’efficacité de l’exécution de modèles d’IA à grande échelle dans les centres de données. La société le présente comme un élément central de son infrastructure hétérogène destinée à supporter multiples modèles — y […]
NVIDIA embauche le fondateur de Groq et license sa technologie d’inférence : un mouvement qui accélère la guerre pour fournir une IA à l’échelle
La course à l’Intelligence Artificielle est en train de changer de cap. Pendant des années, l’attention médiatique et technique s’est concentrée sur le training — modèles toujours plus grands, plus coûteux et davantage dépendants de capacités de calcul —. Mais à mesure que l’IA devient un produit intégré, le véritable goulot d’étranglement se déplace vers […]
SK hynix obtient la certification d’Intel pour son RDIMM DDR5 de 256 Go et vise la nouvelle vague d’inférence dans les centres de données

Dans sa course effrénée pour optimiser les infrastructures d’intelligence artificielle, SK hynix a annoncé avoir obtenu la certification Intel Data Center Certified pour son module serveur DDR5 RDIMM de 256 Go. Ce module, basé sur des puces DRAM de 32 Gb fabriquées sur le processus 1b (cinquième génération de la “classe 10 nm”), sera désormais […]