GPU | Actualite Cloud

Cerebras défie NVIDIA sur la vitesse d’inférence

OpenAI regarde Cerebras pour renforcer sa puissance d'inférence et réduire sa dépendance à d'autres fournisseurs

Cerebras remet sur la table une question gênante pour l’industrie de l’IA : et si le problème ne résidait pas dans le nombre de GPU, mais dans une dépendance excessive à une architecture conçue à l’origine pour d’autres types de charges ? Andrew Feldman, cofondateur et CEO de Cerebras, défend depuis longtemps cette thèse : […]

Pénurie de mémoire HBM : comment NVIDIA a pris l’avance

ADATA alerte : la DRAM entre en zone critique et augmentera davantage en 2026

La pénurie de mémoire est devenue l’un des principaux points de tension dans l’industrie technologique. Elle ne concerne plus uniquement le prix des modules DRAM de consommation ou des serveurs traditionnels. La demande croissante en intelligence artificielle a poussé la pression jusqu’à la mémoire HBM, LPDDR et autres composants essentiels à la construction d’accélérateurs, de […]

GPU pour datacenters : marchés, acteurs et enjeux IA

Elon Musk présente Colossus : Le cluster IA le plus puissant du monde

Les GPU pour datacenters ne sont plus une composante spécialisée : ce sont devenus l’un des éléments les plus convoiités de l’infrastructure numérique. L’IA générative, l’entraînement de modèles, l’inférence à grande échelle, l’analyse avancée, la simulation scientifique et les services cloud stimulent une demande qui ne concerne plus seulement les fabricants de puces. Elle implique […]

NVIDIA et Vera Rubin : le débat sur le coût réel de l’IA

VAST Data et NVIDIA intègrent l'« AI OS » dans le serveur : CNode-X vise à simplifier la pile IA et à accélérer RAG ainsi que la recherche vectorielle

NVIDIA reste la société qui tire l’infrastructure de l’intelligence artificielle, mais le débat de marché a glissé. La question n’est plus seulement de savoir si ses GPU sont les plus puissants ou si son environnement logiciel reste le plus complet. Ce qui monte chez les clients, les analystes et les ingénieurs, c’est un sujet plus […]

RoCE et clusters GPU : le guide pour Ethernet sans perte

RoCE pour l'IA : guide technique pour la conception d'Ethernet sans perte dans les grappes GPU

Le réseau est devenu l’un des éléments les plus critiques de l’infrastructure IA. Pendant des années, beaucoup d’équipes ont traité Ethernet comme une couche généraliste : stable, connue, relativement économique et suffisamment flexible pour presque toutes les charges en entreprise. Dans un cluster IA moderne, cette vision n’est plus suffisante. Quand un millier de GPUs entraînent […]

Cloud à 875 Md€ en 2026 : l’IA gonfle les dépenses et créuse le gaspillage

FinOps cloud 2026 : gaspillage à 254 milliards d'euros et l'IA qui amplifie les dérives budgétaires

La facturation cloud est devenue une étape nettement plus complexe pour les entreprises. On ne parle plus seulement d’acheter de la capacité pour croître, déployer des produits plus vite ou accélérer des projets d’IA. Le vrai problème, c’est la part croissante des dépenses qui disparait avant de créer de la valeur : machines sous charge, […]

NVIDIA Vera : le CPU maison qui vise 200 milliards dans les centres de données

NVIDIA présente pour la première fois le superchip Vera Rubin : deux GPU "de taille réticulaire", CPU Vera de 88 cœurs et objectif de production en 2026

NVIDIA perçoit dans Vera une opportunité à 200 milliards de dollars. Avec son premier CPU maison pour centres de données, l’entreprise s’attaque à un territoire historiquement verrouillé par Intel et AMD — et ne s’en cache pas. Pour le seul exercice en cours, Jensen Huang table sur 20 milliards de revenus CPU. Ce chiffre mérite […]

LineShine : le superordinateur chinois qui entraîne l’IA sans GPU

Lenovo présente sa sixième génération de superordinateurs avec refroidissement liquide pour mener la transformation pilotée par l'IA

La Chine vient de présenter une approche peu conventionnelle pour l’entraînement de modèles d’intelligence artificielle à l’échelle extrême : un supercalculateur basé sur des CPU Armv9, sans dépendre du schéma dominant des grands clusters accélérés par GPU. Le système, nommé LineShine, est installé au Centre National de Supercalculateurs de Shenzhen (NSCC-SZ) et a été décrit […]

Equinix ouvre MD5 à Alcobendas le 22 mai : 9,6 MW pour les charges IA haute densité

Centre de données haute densité Equinix MD5 Alcobendas

Equinix inaugurera le 22 mai son nouveau centre de données MD5 à Alcobendas, dans la banlieue nord de Madrid. Le projet représente un investissement de 460 millions d’euros sur le campus qu’Equinix exploite dans cette commune depuis son rachat d’Itconic en 2017. MD5 ne ressemble pas aux centres de données qu’Equinix a construits il y […]

AMD et Qibo simulent 35 qubits sur une seule GPU MI355X : ce que ça signifie vraiment

AMD et Qibo parviennent à simuler 35 qubits sur une seule GPU Instinct MI355X

AMD et Qibo viennent de simuler exactement un vecteur d’état de 35 qubits sur un seul GPU AMD Instinct MI355X. Ce résultat ne signifie pas qu’AMD a construit un ordinateur quantique de 35 qubits, ni que la suprématie quantique pratique a été atteinte. C’est une simulation classique d’un système quantique — utile, mais fondamentalement différente […]