Amazon a attribué une valeur numérique précise et une scène concrète à la situation actuelle de son infrastructure dédiée à l’intelligence artificielle. Dans sa lettre annuelle aux actionnaires , publiée le 9 avril, le PDG Andy Jassy a affirmé que deux grands clients d’Amazon Web Services ont demandé à acheter toute la capacité d’instances Graviton prévue pour 2026. La société a toutefois décliné cette demande, car elle doit également satisfaire ses autres clients. Cette déclaration ne concerne pas une vente ponctuelle de processeurs, mais bien une capacité cloud complète basée sur ses propres puces, illustrant à quel point la demande est devenue tendue.
Ce message va au-delà d’une simple anecdote. Amazon utilise cette pression de la demande pour défendre sa stratégie ambitieuse en matière d’intelligence artificielle, de centres de données et de silicium propriété. Jassy soutient qu’AWS pourrait croître encore plus rapidement, mais reconnaît que sa capacité demeure limitée. En 2025, la division a injecté 3,9 GW de nouvelle puissance électrique et prévoit de doubler cette capacité avant la fin de 2027. Parallèlement, AWS a terminé son quatrième trimestre 2025 avec une croissance annuelle de 24 %, atteignant un rythme de revenus annuel d’environ 142 milliards de dollars.
Graviton, de projet interne à ressource stratégique rare
Graviton a été le premier processeur majeur conçu par Amazon pour son propre cloud, lancé en 2018. Depuis, la famille a atteint sa cinquième génération. Selon la société, plus de 90 000 clients l’utilisent aujourd’hui, représentant 98 % des 1 000 plus grands clients d’EC2, le service de calcul à la demande d’AWS. Amazon a présenté le Graviton5 en décembre 2025, le décrivant comme sa CPU la plus puissante à ce jour, avec jusqu’à 25 % de performance en plus que la génération précédente dans certains scénarios.
Ce détail éclaire l’importance de la déclaration de Jassy. Depuis plusieurs mois, le marché se concentre sur les GPU de Nvidia et la pénurie d’accélérateurs pour l’IA. Cependant, la lettre d’Amazon montre que le goulet d’étranglement ne se limite pas à l’entraînement de grands modèles, mais concerne également la capacité globale de calcul pour soutenir des applications d’entreprise, des bases de données, de l’analytique, de l’inférence et des services cloud à grande échelle. La volonté de deux clients de réserver toute l’offre annuelle d’instances Graviton montre que la valeur stratégique des puces propres d’AWS n’est plus un simple complément : c’est une ressource critique au sein de leur portefeuille.
En plus, Amazon entend faire en sorte que cette stratégie dépasse le seul cadre des CPU. Dans la même lettre, Jassy indique que Trainium2 a été presque entièrement réservé, que Trainium3 a commencé à être expédié début 2026 et est presque totalement engagé, et qu’une part importante de Trainium4 est déjà réservée, en dépit du fait qu’il reste encore environ 18 mois avant sa disponibilité générale. En combinant Graviton, Trainium et Nitro, Amazon situe son activité de fabrication de puces à plus de 20 milliards de dollars de revenus annuels, avec une croissance à trois chiffres d’une année sur l’autre. La société évoque même, pour l’avenir, la possibilité de vendre des racks de ces systèmes à des tiers.
La course à la capacité et à l’énergie
La véritable enjeu ne se limite pas à la conception des processeurs, mais à la vitesse à laquelle il faut déployer une infrastructure physique. Amazon prévoit d’investir environ 200 milliards de dollars en capex en 2026, justifiant cet effort non par intuition, mais par des engagements déjà signés ou très avancés avec ses clients. Une part significative de cette dépense sera monétisée entre 2027 et 2028. La société souligne également que ses actifs ont de longues durées de vie : plus de 30 ans pour ses centres de données, et entre 5 et 6 ans pour le matériel comme les puces, serveurs et équipements réseau.
Cette explication est essentielle, car le marché se demande depuis des mois si la dépense en IA ne s’accélère pas trop vite. La réponse d’Amazon est que la demande est déjà bien là et que ses propres puces en silicium pourraient révolutionner l’économie de son activité cloud. Jassy affirme que Trainium pourrait permettre à l’entreprise d’économiser des dizaines de milliards de dollars par an en investissements en capital, tout en améliorant de plusieurs points de pourcentage la marge opérationnelle, en évitant une dépendance totale aux chips tiers pour l’inférence. Même si ce ne sont que des prévisions, ces chiffres illustrent la détermination d’Amazon à faire cet investissement massif, malgré les risques.
Plus d’investissement aujourd’hui pour assurer ses marges demain
Le coût commence à se faire sentir dans les comptes. Dans son rapport annuel 2025, Amazon indique que le flux de trésorerie disponible a chuté de 38,2 milliards à 11,2 milliards de dollars, principalement en raison de l’augmentation de 50,7 milliards des dépenses d’investissements liés à l’immobilisation, hors ventes et incitations. La société lie cette dégradation, en grande partie, à ses investissements dans l’intelligence artificielle. C’est, en quelque sorte, le prix de vouloir devancer ses concurrents en termes de capacité de calcul, d’énergie et de déploiement de centres de données.
À court terme, cela pèse sur la trésorerie. À moyen et long terme, Amazon croit que la synergie entre AWS, IA et ses propres puces permettra d’accroître ses revenus, ses marges et sa génération de trésorerie. La stratégie comporte des risques, notamment que la demande continue de croître, que la monétisation se réalise dans les délais, et que l’expansion à si grande échelle se déroule sans dérapages majeurs. Mais la scène décrite par Jassy — deux grands clients tentant de s’accaparer toute la capacité Graviton d’une année — montre que Amazon estime que cela vaut la peine de prendre ce risque. Dans l’univers du cloud, la pénurie ne se limite plus aux puces : elle concerne aussi le temps, l’électricité et la capacité prête à l’emploi.
Foire aux questions
Qu’est-ce qu’AWS Graviton et à quoi sert-il ?
AWS Graviton est la famille de processeurs conçue par Amazon pour son cloud. Utilisée dans les instances EC2, cette gamme vise des charges telles que les applications d’entreprise, les bases de données, l’analytique, les services web, et de plus en plus, les tâches liées à l’IA et à l’inférence. Amazon a lancé la première génération en 2018, et aujourd’hui, elle en est à sa cinquième version.
Que signifie qu’à deux clients aient voulu toute la capacité Graviton de 2026 ?
Cela signifie que deux grands clients AWS ont demandé à réserver l’intégralité de l’offre annuelle d’instances basées sur Graviton pour cette année-là. Amazon a refusé, car elle doit répartir cette capacité entre plusieurs clients, mais cette demande révèle une demande très forte pour ses infrastructures propre.
Combien Amazon prévoit-elle d’investir dans l’IA et les centres de données en 2026 ?
Amazon prévoit environ 200 milliards de dollars d’investissements en capex pour 2026, avec une majorité de cette dépense soutenue par des engagements client et une monétisation attendue entre 2027 et 2028.
En quoi Graviton et Trainium diffèrent-ils au sein d’AWS ?
Graviton est la ligne de CPU généraliste d’Amazon pour le cloud, tandis que Trainium est une gamme de puces spécifiquement conçue pour l’entraînement et l’inférence en IA. Dans sa lettre aux actionnaires, Amazon met en avant ces deux familles comme des éléments clés pour réduire les coûts et diminuer sa dépendance aux fournisseurs externes.