La facturation cloud est devenue une étape beaucoup plus délicate pour les entreprises. Il ne s’agit plus uniquement d’acheter plus de capacité pour croître, déployer des produits plus rapidement ou accélérer des projets d’intelligence artificielle. Le véritable défi réside dans la part croissante des dépenses qui s’évapore avant de créer de la valeur : machines en fonctionnement sans charge, clusters surdimensionnés, stockage inutilisé, snapshots obsolètes, trafic mal optimisé, licences inutilisées et GPU réservées à des charges IA sous-utilisées.
Les chiffres du marché deviennent difficiles à digérer. Gartner estime que les dépenses mondiales des utilisateurs finals en cloud public atteindraient 723,4 milliards de dollars en 2025, soit environ 614,9 milliards d’euros selon le taux de change de la BCE du 11 mai 2026. Forrester prévoit un marché dépassant 1,03 trillion de dollars en 2026, soit environ 875,5 milliards d’euros. La conversion n’est pas un détail mineur : pour les budgets européens, le cloud n’est plus une simple ligne de dépense IT, mais une enveloppe comparable à des secteurs industriels entiers.
L’intelligence artificielle accentue cette pression. Flexera indique que la part du gaspillage cloud a augmenté pour atteindre 29 % en 2026, après cinq années de diminution, en raison de la complexité des charges IA et de la prolifération des nouveaux services IaaS et PaaS. En appliquant ce taux à la prévision de Forrester pour 2026, le gaspillage potentiel frôle les 254 milliards d’euros. Il ne s’agit pas d’une inefficacité marginale, mais d’un trou structurel.
De la croissance cloud à la dérive financière
Pendant des années, le cloud a été défendu par une promesse séduisante : payer uniquement ce que l’on utilise. En théorie, ce modèle est plus flexible que l’achat de serveurs, la surdimension de datacenters ou l’attente d’années pour amortir du matériel. En pratique, beaucoup d’entreprises ont transposé au cloud les mauvaises habitudes du passé, avec une facture qui se renouvelle chaque mois.
Le mécanisme est connu. Une équipe provisionne pour les pics, mais le système fonctionne presque toujours à des valeurs moyennes. Un autre crée un environnement de test et ne l’éteint pas. Un projet est annulé, mais laisse des disques, snapshots ou bases de données orphelines. Kubernetes réserve plus de CPU et de mémoire que nécessaire. Un modèle d’IA démarre comme pilote et finit par générer des coûts continus en tokens, GPU et stockage, sans lien clair avec un produit, un client ou un résultat.
Les données recueillies par Zop à partir de Flexera, Gartner, la FinOps Foundation, Datadog et HashiCorp convergent : la dépense cloud augmente plus vite que la discipline de gestion. Le marché 2025 avoisinerait les 614,9 milliards d’euros, tandis que le montant des dépenses inutilisées tournerait entre 154,7 milliards d’euros (en se basant sur la donnée de 182 milliards de dollars citée par Zop) et 166 milliards d’euros (en appliquant directement 27 % au total estimé par Gartner).
Pour 2026, la situation devient encore plus critique. Sur une prévision de 875,5 milliards d’euros, un gaspillage de 29 % représenterait environ 254 milliards d’euros. Ce chiffre équivaut à payer pour une infrastructure inactive, une capacité non contrôlée ou des ressources non liées à une métrique de performance opérationnelle.
| Concept | En dollars | En euros approximatifs |
|---|---|---|
| Dépenses cloud publiques mondiales 2025 | 723,4 M$ | 614,9 M€ |
| Marché cloud public prévu 2026 | 1,03 billion $ | 875,5 M€ |
| Gaspillage identifié par Zop | 182,0 M$ | 154,7 M€ |
| 29 % de gaspillage sur 2026 | 298,7 M$ | 253,9 M€ |
| Économies WPP en trois mois | 2 M$ | 1,7 M€ |
| Économies COMPLY en huit mois | 460 000 $ | 391 000 € |
L’IA fait du FinOps une priorité stratégique
L’adoption de l’intelligence artificielle a modifié la donne. Avant, le FinOps se concentrait principalement sur les instances, le stockage, le trafic, les engagements d’usage, les environnements non productifs et Kubernetes. Désormais, interviennent des variables plus difficiles à maîtriser : coût par token, inférence, entraînement, GPU, modèles multimodaux, agents multipliant les appels, prompts longs et services IA managés qui prolifèrent sans une gouvernance équivalente à celle de l’infrastructure traditionnelle.
La FinOps Foundation détecte déjà cette évolution : 63 % des professionnels du FinOps gèrent des dépenses liées à l’IA, contre 31 % l’année précédente. C’est une avancée significative, mais cela révèle aussi une difficulté inverse : de nombreuses organisations utilisent la Génération IA sans avoir encore une compréhension claire du coût réel de leurs modèles, agents et charges GPU.
L’IA possède une caractéristique risquée pour les budgets : sa croissance est exponentielle, que ça fonctionne ou non. Une équipe peut lancer des dizaines d’expériences, indexer des documents, déployer des agents, créer des sandbox, tester différents modèles ou augmenter la fenêtre de contexte sans que le coût soit immédiatement apparent. La facture arrive plus tard.
Dans l’infrastructure traditionnelle, une machine virtuelle sous-utilisée était déjà un problème. En IA, une GPU coûteuse sous-utilisée peut devenir un enjeu encore plus critique. Selon l’analyse de Zop, l’utilisation moyenne des GPU cloud tournerait autour de 23 %, ce qui laisse un énorme potentiel de capacité payée mais inutilisée. Un exemple dans le secteur évoque une instance NVIDIA H100 sur AWS, coûtant entre 25 000 et 98 000 dollars par an, soit environ 21 250 à 83 300 euros. Si cette GPU est peu exploitée, le coût horaire effectif explose.
Les principales sources de fuite d’argent
Le gaspillage cloud ne se résume pas à une seule origine : il résulte d’un amalgame de mauvaises pratiques techniques, de manque de gouvernance et d’absence de responsables clairs. Si on prend comme référence un gaspillage potentiel de 254 milliards d’euros en 2026, la ventilation indicative par catégories donne une image relativement éloquente :
| Catégorie de gaspillage | Poids estimé | Impact sur 254 milliards d’euros |
|---|---|---|
| Via cloud sous-utilisé | 35 % | 88,9 milliards € |
| Instances surdimensionnées | 25 % | 63,5 milliards € |
| Stockage non relié à des usages | 15 % | 38,1 milliards € |
| Snapshots orphelins | 10 % | 25,4 milliards € |
| Transferts de données mal optimisés | 10 % | 25,4 milliards € | Licences inutilisées | 5 % | 12,7 milliards € |
La consommation oisive reste la principale fuite. Selon Datadog, beaucoup d’organisations maintiennent des instances peu sollicitées longtemps, et l’identification des ressources surdimensionnées ou obsolètes reste difficile dans des environnements éphémères ou complexes. Dans les conteneurs, c’est à peu près la même logique : on conçoit des clusters pour ne pas manquer de ressources, mais leur revue régulière est rarement systématique.
Les environnements non productifs constituent une autre source de gaspillage facilement évitable. Développement, QA, test, staging, démos et sandboxes sont indispensables, mais ils n’ont pas besoin de tourner 168 heures sur 168 si leur utilisation est limitée à 20, 30 ou 40 heures. Éteindre ces environnements en dehors des horaires d’activité, programmer des fenêtres, créer une infrastructure éphémère ou détruire des ressources après un merge permet d’obtenir des économies rapides sans impacter la production.
Voici une clé essentielle : toutes les économies ne requièrent pas des migrations longues ou des refontes complexes. Certaines mesures sont simplement opérationnelles : bien étiqueter, assigner des responsables, identifier les ressources orphelines, programmer l’arrêt, redimensionner les instances, utiliser des engagements de réservation lorsque la demande est stable, automatiser les alertes d’anomalies. Et surtout, ne plus considérer la facture cloud comme une exclusivité des finances.
Un cloud peu coûteux exige une discipline rigoureuse
FinOps ne consiste pas à dépenser moins par principe, mais à dépenser avec discernement. Une entreprise peut justifier une hausse de ses coûts cloud si sa croissance l’impose ou si elle déploie des produits d’IA générant des revenus. Le problème survient lorsque personne ne peut expliquer une part significative de la dépense : ce qui fonctionne, ce qui reste allumé sans réelle nécessité, ce qui ne produit pas de valeur.
La maturité dans la gestion du cloud reste limitée. Beaucoup disposent de tableaux de bord, mais peu agissent réellement. La facture est visualisée, répartie entre équipes, discutée en réunion, mais la gestion opérationnelle reste souvent manuelle, lente ou politiquement sensible. HashiCorp, dans son rapport sur la complexité du cloud, souligne que le manque de visibilité est l’un des principaux freins à la gestion efficace d’infrastructures modernes, surtout dans des environnements multicloud et hybrides.
L’intégration de l’IA rendra cette déconnexion encore plus coûteuse. Un tableau de bord mensuel ne suffit plus lorsque des agents multiplient les appels ou quand une équipe réserve des GPU durant plusieurs jours. Il devient indispensable d’établir des limites, des budgets par modèle, des alertes en quasi-temps réel, des sélection automatique de modèles selon leur coût et leur performance, des caches, de la quantification, l’arrêt des charges inactives, et une attribution beaucoup plus précise.
Le CFO devra également prendre une part plus active dans cette gestion. Le cloud n’est plus une simple décision technique isolée. En 2026, avec un marché dépassant 875 milliards d’euros et un gaspillage potentiel pouvant atteindre 254 milliards, la gouvernance cloud devient une question stratégique, de marges, et de compétitivité.
Pour un média spécialisé en technologie, cette conclusion s’impose : l’IA ne fait pas que stimuler la demande de cloud ; elle met aussi en lumière les mauvaises pratiques. Les entreprises qui gèrent déjà mal des machines virtuelles, des stockages ou Kubernetes risquent de faire encore pire avec GPU, tokens et agents si elles ne changent pas leurs processus. La cloud n’est pas devenue plus coûteuse soudainement, c’est que la facture commence à révéler plus clairement que jamais le coût de sa gouvernance.
Questions fréquentes
Combien d’argent sera gaspillé en cloud en 2026 ?
En appliquant le taux de gaspillage estimé de 29 % par Flexera à la prévision de marché cloud public de Forrester pour 2026, le montant du gaspillage atteindrait environ 254 milliards d’euros.
Pourquoi l’IA augmente-t-elle la dépense inutile en cloud ?
Parce qu’elle introduit des charges plus variables et onéreuses : GPU, inférence, tokens, agents, fenêtres de contexte longues. Sans contrôle, ces coûts croissent plus vite que la capacité à en avoir une vision financière claire.
Qu’est-ce que le FinOps et pourquoi est-ce crucial aujourd’hui ?
Le FinOps est une pratique qui combine ingénierie, finance et business pour rendre transparent le coût du cloud, le responsabiliser et l’optimiser sans bloquer l’innovation. Avec l’IA, son importance devient encore plus grande.
Où se concentrent les économies rapides ?
Dans les environnements de développement, test et staging allumés en dehors des heures, les instances surdimensionnées, les ressources orphelines, le stockage inutilisé, et la mauvaise gestion des engagements d’usage.
Source : Noticias inteligencia artificielle