GPU | Actualite Cloud

Google alerte : la mémoire freine les grands modèles d’IA

TurboTax : Google met en garde contre la mémoire qui entrave les grands modèles

Google alerte : la mémoire, pas le calcul, est le vrai goulot d’étranglement des grands modèles d’IA. La bande passante mémoire est souvent le facteur limitant pour l’inférence, pas la puissance GPU. Solutions : architectures HBM plus rapides, quantification, caches KV optimisés. Cela explique pourquoi SK hynix mise sur la HBM5 hybride et pourquoi la […]

Data centers IA : transformateurs, batteries et réseau électrique freinent la course

Virginia se part en los centros de datos : l'exemption fiscale de 5,3 % est en jeu et l'horloge tourne vers 2027

Près de 50 % des projets de data centers IA aux États-Unis butent sur l’électricité selon Bloomberg. Transformateurs, batteries et raccordement au réseau prennent des années. La construction physique n’est plus le goulot : c’est l’énergie. Ce problème explique pourquoi Amazon développe le Project Houdini de data centers préfabriqués — accélérer la construction ne suffit […]

Microsoft et Google protègent leur DRAM avec SK hynix face à l’IA

SK hynix avertit : la pénurie de wafers de mémoire pourrait durer jusqu'en 2030

La mémoire devient un goulet d’étranglement critique. Microsoft et Google cherchent à sécuriser leur approvisionnement DRAM avec SK hynix face à la demande explosive de l’IA. SK hynix mise aussi sur la HBM5 hybride pour les GPU IA, et Gartner prévoit 1,3 trillion $ pour les semi-conducteurs en 2026. Questions fréquentes Pourquoi sécuriser la DRAM […]

Rowhammer frappe les GPU NVIDIA avec GDDR6 : nouvelle menace

Nouvelles attaques Rowhammer alertent plusieurs GPU NVIDIA avec GDDR6

La vulnérabilité Rowhammer revient avec de nouvelles attaques ciblant les GPU NVIDIA équipés de mémoire GDDR6. Deux équipes de recherche indépendantes démontrent que la mémoire graphique est vulnérable. Cela soulève des questions de sécurité pour les environnements IA partagés et les data centers utilisant ces GPU. Face aux vulnérabilités matérielles, la cybersécurité IA devient un […]

NVIDIA domine MLPerf Inference v6.0 : Blackwell Ultra repousse les limites

NVIDIA présente pour la première fois le superchip Vera Rubin : deux GPU "de taille réticulaire", CPU Vera de 88 cœurs et objectif de production en 2026

NVIDIA continue de transformer les benchmarks MLPerf en démonstration de puissance. Lors de l’édition MLPerf Inference v6.0, l’entreprise affirme avoir obtenu les meilleurs résultats sur le plus grand nombre de tests, en s’appuyant sur Blackwell Ultra et le système GB300 NVL72. Les chiffres sont vertigineux : 2,49 millions de tokens par seconde avec DeepSeek-R1 en […]

NVIDIA Vera Rubin : la chaîne d’approvisionnement mise à l’épreuve

NVIDIA Rubin CPX : le GPU qui redéfinit l'inférence de contexte longue à l'ère de l'IA

NVIDIA confirme que Vera Rubin NVL72 est en production et que ses systèmes seront déployés au second semestre 2026. Mais derrière cette feuille de route, un rapport DIGITIMES révèle que la conception de la compute tray n’est pas totalement finalisée : NVIDIA révise certains composants pour diversifier ses fournisseurs et réduire les dépendances critiques. Quand […]

SUSE renforce Rancher Prime et Virtualization avec IA et GPU partagés

SUSE acquiert Losant pour moderniser l'IoT industriel avec une plateforme d'automatisation des processus ouverte et complète en edge

SUSE a annoncé une nouvelle série de capacités pour SUSE Rancher Prime et SUSE Virtualization, visant à impulser deux idées clés : l’utilisation d’une IA autonome pour simplifier la gestion des infrastructures et un rapprochement accru dans la gestion conjointe des machines virtuelles et des conteneurs. Présentées le 24 mars, ces innovations s’inscrivent dans une […]

NVIDIA arrive à GTC 2026 avec l’inférence au centre et des doutes sur le GPU unique

NVIDIA trace sa feuille de route au CES 2026 : Rubin, modèles ouverts et « mémoire » pour l’IA agissante

NVIDIA lance aujourd’hui la GTC 2026 à San José dans un contexte marqué par une approche différente de celle des années précédentes. La conférence se déroule du 16 au 19 mars, et la keynote de Jensen Huang est prévue pour ce lundi, lors d’un événement où la société elle-même annonce des nouveautés concernant l’Intelligence Artificielle, […]

NVIDIA Vera Rubin n’est plus seulement une GPU : ainsi évolue l’IA agentique

NVIDIA a profité du GTC 2026 pour clarifier que son prochain grand projet ne tourne plus autour d’une seule GPU ultra-puissante, mais d’une plateforme complète conçue pour couvrir toutes les phases de l’intelligence artificielle moderne. Baptisée Vera Rubin, la société a présenté un ensemble de sept puces et cinq types de racks qui, selon leur […]

Akamai signe un contrat de 200 millions de dollars pour renforcer les infrastructures d’IA avec des milliers de GPU NVIDIA Blackwell

Akamai Technologies a dévoilé de nouveaux détails concernant un contrat de services d’une valeur de 200 millions de dollars pour une durée de quatre ans, signé avec une grande entreprise technologique américaine spécialisée dans le calcul haute performance pour l’intelligence artificielle. Selon les termes du contrat, le client déploiera un cluster composé de milliers de […]