La facturation cloud est devenue une étape nettement plus complexe pour les entreprises. On ne parle plus seulement d’acheter de la capacité pour croître, déployer des produits plus vite ou accélérer des projets d’IA. Le vrai problème, c’est la part croissante des dépenses qui disparait avant de créer de la valeur : machines sous charge, clusters surdimensionnés, stockage abandonné, snapshots obsolètes, trafic non optimisé, licences inutilisées, GPU réservées à des charges IA sous-exploitées.
Les chiffres donnent le vertige. Gartner estime les dépenses mondiales en cloud public à 723,4 milliards de dollars en 2025, soit environ 614,9 milliards d’euros au taux BCE du 11 mai 2026. Forrester prévoit un marché dépassant 1,03 trillion de dollars en 2026, soit environ 875,5 milliards d’euros. Ce ne sont plus de simples lignes IT : pour les budgets européens, le cloud pese autant que certains secteurs industriels entiers.
Flexera mesure que le gaspillage cloud a remounté à 29 % en 2026, après cinq ans de diminution, en raison de la complexité des charges IA et de la prolifération de nouveaux services IaaS et PaaS. Appliqué à la prévision Forrester, cela représente 254 milliards d’euros de gaspillage potentiel en 2026. Un trou structurel, pas une inefficacité marginale.
De la croissance cloud à la dérive financière
Le cloud avait une promesse : payer uniquement ce qu’on utilise. En théorie, plus flexible que l’achat de serveurs ou la surdimension de datacenters. En pratique, beaucoup d’entreprises ont transposé les mauvaises habitudes du passé, avec une facture qui se renouvelle chaque mois.
Le mécanisme est connu. Une équipe provisionne pour les pics mais le système tourne presque toujours à charge moyenne. Un autre crée un environnement de test et ne l’éteint pas. Un projet est annulé mais laisse des disques, snapshots ou bases de données orphelins. Kubernetes réserve plus de CPU et de mémoire que nécessaire. Un modèle d’IA démarre comme pilote et finit par générer des coûts continus en tokens, GPU et stockage, sans lien clair avec un produit ou un résultat.
Les données de Flexera, Gartner, FinOps Foundation, Datadog et HashiCorp convergent toutes sur le même constat : la dépense cloud augmente plus vite que la discipline de gestion. Sur le marché 2025 autour de 614,9 milliards d’euros, le gaspillage estimé se situe entre 154,7 et 166 milliards d’euros selon la source et le taux retenu.
| Concept | En dollars | En euros approximatifs |
|---|---|---|
| Dépenses cloud publiques mondiales 2025 | 723,4 Md$ | 614,9 Md€ |
| Marché cloud public prévu 2026 | 1,03 billion $ | 875,5 Md€ |
| Gaspillage identifié par Zop | 182,0 Md$ | 154,7 Md€ |
| 29 % de gaspillage sur 2026 | 298,7 Md$ | 253,9 Md€ |
| Économies WPP en trois mois | 2 M$ | 1,7 M€ |
| Économies COMPLY en huit mois | 460 000 $ | 391 000 € |
L’IA fait du FinOps une priorité stratégique
L’adoption de l’IA a changé la donne. Avant, le FinOps portait principalement sur les instances, le stockage, le trafic, les engagements d’usage, les environnements non productifs et Kubernetes. Aujourd’hui s’ajoutent des variables bien plus difficiles à maîtriser : coût par token, inférence, entraînement, GPU, modèles multimodaux, agents qui multiplient les appels, prompts longs et services IA managés qui prolifissent sans gouvernance adaptée.
La FinOps Foundation recense déjà cette évolution : 63 % des professionnels du FinOps gèrent des dépenses liées à l’IA, contre 31 % l’année précédente. Mais ce doublement révèle aussi une lacune : beaucoup d’organisations déploient de la genérative IA sans comprendre le coût réel de leurs modèles, agents et charges GPU.
L’IA a une propriété dangereuse pour les budgets : sa croissance est exponentielle, que ça fonctionne ou non. Une équipe peut lancer des dizaines d’expériences, indexer des documents, déployer des agents, créer des sandbox, tester différents modèles ou augmenter la fenêtre de contexte sans que le coût soit immédiatement visible. NVIDIA et Dell soulignent que l’IA générative devient le cœur des investissements en centres de données, mais cette croissance infrastructure n’annule pas la nécessité d’une gouvernance des coûts.
Selon Zop, l’utilisation moyenne des GPU cloud tourne autour de 23 %, laissant 77 % de capacité payée mais inutilisée. Un exemple fréquent dans le secteur : une instance NVIDIA H100 sur AWS coûte entre 25 000 et 98 000 dollars par an (21 250 à 83 300 euros). Si cette GPU est sous-exploitée, le coût horaire effectif explose.
Les principales sources de fuite d’argent
Le gaspillage cloud ne vient pas d’une seule origine. C’est la combinaison de mauvaises pratiques techniques, d’un manque de gouvernance et d’une absence de responsables clairement identifiés. Sur les 254 milliards d’euros potentiellement gaspillés en 2026, la répartition indicative par catégorie :
| Catégorie de gaspillage | Poids estimé | Impact sur 254 Md€ |
|---|---|---|
| Ressources cloud sous-utilisées | 35 % | 88,9 Md€ |
| Instances surdimensionnées | 25 % | 63,5 Md€ |
| Stockage non relié à des usages actifs | 15 % | 38,1 Md€ |
| Snapshots orphelins | 10 % | 25,4 Md€ |
| Transferts de données mal optimisés | 10 % | 25,4 Md€ |
| Licences inutilisées | 5 % | 12,7 Md€ |
La consommation oisive reste la première fuite. Datadog confirme que beaucoup d’organisations maintiennent des instances peu sollicitées longtemps, et que l’identification des ressources surdimensionnées reste difficile dans des environnements éphémères ou complexes. Les conteneurs suivent la même logique : on conçoit des clusters pour ne jamais manquer de ressources, mais leur revue régulière est rarement systématique.
Les environnements non productifs représentent une autre source évitable. Développement, QA, test, staging, démos et sandboxes sont indispensables, mais inutile de les faire tourner 168 heures sur 168 si leur utilisation réelle se concentre sur 20 à 40 heures. Les arrêter hors des plages actives, détruire les ressources après un merge, créer une infrastructure éphémère : autant de mesures qui génèrent des économies rapides sans toucher à la production.
Un cloud moins coûteux exige une discipline rigoureuse
Le FinOps n’est pas une démarche d’économies systématiques. Une hausse des coûts cloud peut se justifier si la croissance l’impose ou si les modèles d’IA déployés génèrent des revenus mesurables. Le problème apparaît quand personne ne peut expliquer une part significative de la dépense : ce qui tourne, ce qui reste allumé sans nécessité, ce qui ne produit pas de valeur.
La maturité dans la gestion du cloud reste limitée. Beaucoup disposent de tableaux de bord, peu agissent vraiment. La facture est visualisée, répartie entre équipes, discutée en réunion, mais la gestion opérationnelle reste souvent manuelle et lente. HashiCorp souligne que le manque de visibilité est l’un des principaux freins dans les environnements multicloud et hybrides.
L’IA d’entreprise crée des tensions entre performance et goûvernance des données, et les dépenses GPU en sont un reflet direct. Un tableau de bord mensuel ne suffit plus quand des agents multiplient les appels ou quand une équipe réserve des GPU plusieurs jours. Il faut des limites par modèle, des alertes quasi-temps réel, une sélection automatique des modèles selon leur coût, des caches, de la quantification et une attribution précise.
En 2026, avec un marché dépassant 875 milliards d’euros et un gaspillage potentiel autour de 254 milliards, la gouvernance cloud devient une question de marges et de compétitivité, pas seulement un sujet IT. Les entreprises qui gèrent déjà mal les machines virtuelles et Kubernetes feront pire avec les GPU, les tokens et les agents si elles ne changent pas leurs processus.
Questions fréquentes
Combien d’argent sera gaspillé en cloud en 2026 ?
En appliquant le taux de 29 % estimé par Flexera à la prévision de marché de Forrester pour 2026 (875,5 Md€), le gaspillage potentiel atteindrait environ 254 milliards d’euros.
Pourquoi l’IA augmente-t-elle la dépense inutile en cloud ?
L’IA introduit des charges plus variables et coûteuses : GPU, inférence, tokens, agents, grandes fenêtres de contexte. Sans contrôle, ces coûts croissent plus vite que la capacité à en avoir une vision financière claire et en temps réel.
Qu’est-ce que le FinOps et pourquoi est-ce crucial aujourd’hui ?
Le FinOps combine ingénierie, finance et business pour rendre le coût du cloud transparent, responsabilisé et optimisable sans bloquer l’innovation. Avec l’IA, son périmètre s’étend et son urgence augmente.
Où se concentrent les économies rapides en cloud ?
Dans les environnements de développement, test et staging allumés hors des heures actives, les instances surdimensionnées, les ressources orphelines, le stockage inutilisé et la mauvaise gestion des engagements d’usage.
Source : Noticias inteligencia artificial