Google et NVIDIA rapprochent les clusters d’IA du million de GPUs Rubin

NVIDIA Rubin CPX : le GPU qui redéfinit l'inférence de contexte longue à l'ère de l'IA

Google Cloud et NVIDIA ont renforcé leur partenariat afin de déployer la prochaine génération de GPU Vera Rubin dans l’infrastructure AI Hypercomputer de Google. L’annonce concerne la famille d’instances bare metal A5X, conçue pour des charges de travail en intelligence artificielle agéntique et physics, avec une promesse d’échelle impressionnante : jusqu’à 80 000 GPUs NVIDIA […]

Le rack VR200 de Nvidia fixe le prix de l’« or » de l’IA : jusqu’à 1,8 million de dollars taïwanais pour une seule armoire

Le rack VR200 de Nvidia fixe le prix de l'« or » de l'IA : jusqu'à 1,8 million de dollars taïwanais pour une seule armoire

Sur le marché de l’intelligence artificielle, la compétition ne se résume plus uniquement à celui qui entraîn tous les meilleurs modèles, mais également à celui qui dispose de l’infrastructure capable de les soutenir. Nvidia confirme une fois de plus sa position en proposant une solution dont la puissance et le coût illustrent parfaitement le moment […]

NVIDIA et OpenAI portent l’inférence à 1,5 million de tokens par seconde avec les modèles GPT-OSS sur l’architecture Blackwell

NVIDIA et OpenAI portent l'inférence à 1,5 million de tokens par seconde avec les modèles GPT-OSS sur l'architecture Blackwell

NVIDIA et OpenAI ont franchi une nouvelle étape dans la performance de l’intelligence artificielle avec le lancement des modèles open source gpt-oss-20b et gpt-oss-120b, optimisés pour l’architecture Blackwell. Selon la société, le plus grand modèle atteint jusqu’à 1,5 million de tokens par seconde (TPS) sur un système NVIDIA GB200 NVL72, ce qui permettrait de servir […]

Amazon lance son modèle d’IA générative pour robots et atteint le million d’unités déployées.

Amazon lance son modèle d'IA générative pour robots et atteint le million d'unités déployées.

Amazon renforce son engagement envers l’automatisation intelligente avec DeepFleet, une plateforme d’intelligence artificielle conçue pour optimiser sa flotte robotique. La célèbre entreprise a récemment franchi deux étapes majeures dans sa stratégie d’innovation opérationnelle : elle a déployé son millionième robot et présenté un nouveau modèle fondamental d’intelligence artificielle générative nommé DeepFleet, dédié à la coordination […]

Meta achètera jusqu’à 1,3 million de GPU Nvidia pour l’intelligence artificielle

Bit Digital annonce un accord stratégique avec DNA AI Compute Fund pour la fourniture de GPU Nvidia H200

La société de Mark Zuckerberg se prépare à rivaliser avec Google et OpenAI avec un investissement record qui comprend 1,3 million de GPU et la construction d’un gigantesque centre de donnéesUn centre de données ou centre de traitement de données (CTD) …. L’avancée de l’intelligence artificielle (IA) a transformé la façon dont les entreprises concurrencent […]