AWS augmente ses « Capacity Blocks » avec GPU pour l’IA : la facture de l’entraînement des modèles recommence à augmenter

Une récente modification discrète dans le catalogue d’Amazon Web Services (AWS) a relancé la discussion sur une réalité souvent ignorée par de nombreuses entreprises : l’infrastructure d’IA est non seulement limitée, mais devient aussi de plus en plus coûteuse à planifier. Plusieurs médias spécialisés ont révélé qu’AWS a augmenté d’environ 15 % le prix de […]
Baidu et Huawei se partagent le « GPU cloud » chinois tandis que la course à l’introduction en bourse s’envole

La Chine commence à élaborer sa propre version du « chip-to-cloud », avec une répartition du pouvoir de plus en plus visible. Au premier semestre 2025, Baidu et Huawei ont conjointement concentré plus de 70 % du marché chinois des services cloud basés sur des GPUs nationales, selon un rapport de Frost & Sullivan qui évalue les fournisseurs […]
Pékin freine brusquement les demandes de H200 : la bataille pour le GPU en Chine entre dans une phase politique

La Chine tente de résoudre une contradiction qui définit désormais sa stratégie technologique : elle a besoin de puissance de calcul immédiate pour entraîner et déployer ses modèles d’intelligence artificielle, tout en souhaitant éviter que cette demande ne crée une dépendance structurelle aux puces américaines. Dans cet équilibre délicat, la dernière annonce venant de Pékin […]
NVIDIA veut que la « mémoire » des agents d’IA survive en dehors du GPU : voici sa nouvelle plateforme de stockage avec BlueField-4

Dans la course effrénée pour faire avancer l’IA agéntique (modèles capables d’enchaîner les tâches, de raisonner sur une période plus longue et de maintenir des conversations avec contexte), NVIDIA concentre actuellement ses efforts sur une problématique très précise : la mémoire de contexte. Lors du CES, la société a annoncé que son BlueField-4 (un processeur […]
Chine resserre la prise et NVIDIA cherche davantage de capacité pour le H200 chez TSMC : la « GPU pont » qui relance la bataille de l’IA

Dans un contexte géopolitique tendu autour de l’Intelligence Artificielle, NVIDIA envisage d’accroître sa production de GPU H200 face à une demande “très forte” en provenance de Chine, qui dépasse déjà ses capacités actuelles de production. Ce mouvement, révélé par Reuters, intervient à un moment particulièrement critique : la société concentre ses efforts industriels sur la […]
YMTC joue la carte de la « mémoire flash haute bande passante » : la mémoire flash que la Chine souhaite rapprocher des GPU d’IA

La course à l’intelligence artificielle ne se résume plus à savoir qui fabrique le plus de GPU ou qui entraîne le plus gros modèle. D’ici 2026, le goulet d’étranglement de plus en plus évident réside dans la mémoire : sa bande passante, sa capacité et surtout sa disponibilité. Dans ce contexte, la Chine commence à […]
Tencent trouve une voie pour utiliser les GPU Blackwell « interdites » de NVIDIA : louer de la puissance de calcul à l’étranger pour contourner le blocage

La course à l’Intelligence Artificielle se transforme de plus en plus en une compétition pour l’accès aux puces. Et lorsque cet accès est bloqué par décret, de nouvelles alternatives apparaissent. Selon les dernières informations concernant Tencent, l’un des géants technologiques chinois, celui-ci aurait trouvé une solution légale mais politiquement sensible pour exploiter les GPU Blackwell […]
Moore Threads montre sa puissance avec deux nouvelles GPU chinoises : Lushan pour le jeu et Huashan pour l’Intelligence Artificielle, promettant une avancée générationnelle

Moore Threads, l’un des fabricants chinois qui cherche à se faire une place sur un marché dominé par NVIDIA et AMD, a présenté dans le cadre de son écosystème MUSA une nouvelle génération de GPU portant deux noms propres : Lushan, destinée aux jeux vidéo et à la création de contenu, et Huashan, conçue pour […]
Nvidia pourrait réduire la production de GPU GeForce en 2026 : une rumeur évoque une baisse de 30 % à 40 % et une pression accrue sur les prix

La disponibilité des cartes graphiques gaming pourrait à nouveau se réduire en 2026. Selon des rumeurs circulant dans la chaîne d’approvisionnement asiatique et relayées par des médias spécialisés, Nvidia envisagerait de réduire significativement la production de puces destinées à la famille GeForce durant le premier semestre de l’année prochaine. Le chiffre évoqué — encore non […]
NVIDIA prépare un logiciel « opt-in » pour surveiller les flottes de GPU dans les centres de données et promet la transparence : pas de « kill switch » ni de portes dérobées

Alors que l’infrastructure d’intelligence artificielle s’accroît en taille et en complexité, les centres de données ressemblent de moins en moins à une pièce remplie de serveurs et de plus en plus à un organisme vivant : des milliers de composants fonctionnant à leur maximum, consommant de l’énergie à des rythmes variables et générant de la […]