
L’inférence de l’IA chutera de plus de 90 %, mais la facture totale ne diminuera pas autant
L’économie de l’Intelligence Artificielle générative va radicalement se transformer au cours de cette décennie. Selon une nouvelle prévision de Gartner, d’ici 2030, l’inférence sur un grand modèle de langage de 1 billion de paramètres coûtera aux fournisseurs d’IA plus de 90 % de moins qu’en 2025. La société souligne également que les LLM de 2030 pourraient être jusqu’à 100 fois plus efficaces en termes de coût que les premiers modèles de taille comparable développés en 2022. Ce chiffre est remarquable mais peut aussi être trompeur s’il est interprété sans le contexte approprié. Car la nouvelle ne se résume pas uniquement à la baisse des coûts d’inférence. La véritable dimension essentielle concerne autre chose : le coût par token va diminuer,




