AWS Graviton : deux clients voulaient toute la capacité en 2026

Deux grands clients ont voulu toute la capacité Graviton d'AWS en 2026

Amazon a attribué une valeur numérique précise à la situation actuelle de son infrastructure dédiée à l’intelligence artificielle. Dans sa lettre annuelle aux actionnaires, publiée le 9 avril, le PDG Andy Jassy a affirmé que deux grands clients d’Amazon Web Services ont demandé à acheter toute la capacité d’instances Graviton prévue pour 2026. La société a décliné cette demande, car elle doit également satisfaire ses autres clients. Cette déclaration illustre à quel point la demande est devenue tendue.

Ce message va au-delà d’une simple anecdote. Amazon utilise cette pression pour défendre sa stratégie ambitieuse en matière d’IA, de centres de données et de silicium propriétaire. Jassy soutient qu’AWS pourrait croître encore plus rapidement, mais reconnaît que sa capacité demeure limitée. En 2025, la division a injecté 3,9 GW de nouvelle puissance électrique et prévoit de doubler cette capacité avant fin 2027. Parallèlement, AWS a terminé son quatrième trimestre 2025 avec un rythme de revenus annuel d’environ 142 milliards de dollars. Pour accélérer ce déploiement, Amazon explore aussi de nouvelles méthodes de construction via le Project Houdini.

Graviton, de projet interne à ressource stratégique rare

Graviton a été le premier processeur majeur conçu par Amazon pour son propre cloud, lancé en 2018. Depuis, la famille a atteint sa cinquième génération. Selon la société, plus de 90 000 clients l’utilisent aujourd’hui, représentant 98 % des 1 000 plus grands clients d’EC2.

La lettre d’Amazon montre que le goulet d’étranglement ne se limite pas aux GPU pour l’entraînement de grands modèles, mais concerne également la capacité globale de calcul pour soutenir des applications d’entreprise, des bases de données, de l’analytique et de l’inférence à grande échelle.

En plus, Jassy indique que Trainium2 a été presque entièrement réservé, que Trainium3 a commencé à être expédié début 2026 et est presque totalement engagé — un accélérateur qui intéresse déjà des acteurs comme Uber pour son moteur d’IA — et qu’une part importante de Trainium4 est déjà réservée malgré 18 mois avant sa disponibilité générale. En combinant Graviton, Trainium et Nitro, Amazon situe son activité de fabrication de puces à plus de 20 milliards de dollars de revenus annuels.

La course à la capacité et à l’énergie

Amazon prévoit d’investir environ 200 milliards de dollars en capex en 2026, justifiant cet effort par des engagements déjà signés. La société souligne que ses actifs ont de longues durées de vie : plus de 30 ans pour ses centres de données, et entre 5 et 6 ans pour le matériel. Mais comme le montrent les obstacles électriques qui freinent la construction des data centers IA, la course ne dépend pas uniquement des GPU mais aussi de l’énergie.

Jassy affirme que Trainium pourrait permettre à l’entreprise d’économiser des dizaines de milliards de dollars par an en investissements en capital, tout en améliorant la marge opérationnelle, en évitant une dépendance totale aux chips tiers pour l’inférence.

Plus d’investissement aujourd’hui pour assurer ses marges demain

Le coût commence à se faire sentir. Le flux de trésorerie disponible a chuté de 38,2 milliards à 11,2 milliards de dollars, principalement en raison de l’augmentation des dépenses d’investissements liés à l’IA. C’est le prix de vouloir devancer ses concurrents en capacité de calcul, d’énergie et de déploiement.

À moyen et long terme, Amazon croit que la synergie entre AWS, IA et ses propres puces permettra d’accroître ses revenus, ses marges et sa génération de trésorerie. La scène décrite par Jassy — deux grands clients tentant de s’accaparer toute la capacité Graviton d’une année — montre que dans l’univers du cloud, la pénurie ne se limite plus aux puces : elle concerne aussi le temps, l’électricité et la capacité prête à l’emploi.

Questions fréquentes

Qu’est-ce qu’AWS Graviton ?
La famille de processeurs conçue par Amazon pour son cloud, lancée en 2018, utilisée par plus de 90 000 clients pour des charges d’entreprise, bases de données, analytique et inférence IA.

Que signifie que deux clients aient voulu toute la capacité Graviton ?
Deux grands clients AWS ont demandé à réserver l’intégralité de l’offre annuelle d’instances Graviton pour 2026. Amazon a refusé pour répartir la capacité.

Combien Amazon prévoit-elle d’investir en 2026 ?
Environ 200 milliards de dollars en capex, principalement dans l’IA et les infrastructures cloud.

En quoi Graviton et Trainium diffèrent-ils ?
Graviton est la ligne de CPU généraliste d’Amazon pour le cloud, Trainium est une gamme spécifiquement conçue pour l’entraînement et l’inférence en IA.

le dernier