OpenAI lance GPT-5.4 et renforce son engagement pour une intelligence artificielle plus utile pour travailler, programmer et gérer des agents

Info Cloud

X (Twitter) Facebook Pinterest LinkedIn Email

OpenAI a dévoilé GPT-5.4 comme étant son nouveau modèle de référence pour le travail professionnel, la programmation et les flux complexes avec des agents, illustrant ainsi la direction que prend la société : moins d’attention à la simple conversation et davantage de focus sur la transformation des modèles en véritables outils capables d’accomplir des tâches concrètes avec une friction réduite, moins de répétitions et une précision accrue.

Le lancement est déjà déployé dans ChatGPT, via l’API et sur Codex. Dans ChatGPT, il apparaît comme GPT-5.4 Thinking, tandis que GPT-5.4 Pro est réservé à ceux qui nécessitent la performance maximale pour des tâches particulièrement exigeantes. L’objectif sous-jacent est important : OpenAI veut que son nouveau modèle serve à la fois au raisonnement, à la programmation, à la navigation dans des outils, à la manipulation de documents, à l’utilisation de feuilles de calcul, à la préparation de présentations et au maintien du contexte sur des processus longs. En d’autres termes : il ne s’agit plus seulement de répondre de manière pertinente, mais de réaliser un travail utile de bout en bout.

La société affirme que GPT-5.4 intègre le meilleur de ses avancées récentes en termes de raisonnement, de programmation et de flux argumentaux. Il reprend également une grande partie des forces de GPT-5.3-Codex, son modèle spécifiquement orienté coding, et les transpose dans un système plus généraliste. Cette convergence constitue l’un des points clés de l’annonce, permettant d’expliquer pourquoi OpenAI le présente non pas comme une simple variante, mais comme le nouveau centre névralgique de son écosystème.

Un des aspects les plus remarquables de ce lancement est l’ambition de voir GPT-5.4 comme un outil pertinent pour le travail professionnel spécialisé. Selon l’évaluation GDPval, qui mesure la capacité des agents à produire des résultats dans 44 professions réparties sur 9 grandes industries, GPT-5.4 atteint un taux de victoires ou d’égalité de 83,0 %, contre 70,9 % pour GPT-5.2. La différence n’est pas négligeable. OpenAI indique que le modèle égalise voire dépasse encore souvent la performance de professionnels humains, renforçant ainsi le message que l’intelligence artificielle ne se limite plus à l’assistance, mais commence à participer activement à des tâches structurées de nature professionnelle.

Les améliorations se ressentent également dans des domaines très spécifiques. OpenAI précise que GPT-5.4 a été soigneusement ajusté pour produire et éditer des feuilles de calcul, des présentations et des documents. Dans une évaluation interne similaire à celles d’analystes juniors en banque d’investissement, il obtient en moyenne un score de 87,3 %, contre 68,4 % pour GPT-5.2. En ce qui concerne les présentations, les évaluateurs humains ont préféré celles générées par GPT-5.4 dans 68,0 % des cas, pour leur meilleure esthétique, leur diversité visuelle accrue et une utilisation plus efficace de la génération d’images.

Pour OpenAI, cette évolution ne concerne pas seulement la qualité, mais aussi l’efficience. GPT-5.4 consomme moins de tokens pour résoudre des problèmes comparé à GPT-5.2, ce qui devrait réduire le coût global de nombreux flux de travail, même si le prix par token augmente. Sur l’API, GPT-5.4 coûte 2,50 dollars par million de tokens d’entrée et 15 dollars par million de tokens de sortie pour des requêtes jusqu’à 272 000 tokens. La version Pro augmente à 30 dollars pour l’entrée et 180 dollars pour la sortie. Au-delà de 272 000 tokens, les tarifs progressent, ce qui confirme que la capacité de traiter de longues contextes reste une option très puissante, mais coûteuse.

Un autre point fort de cette version est sa fenêtre de contexte pouvant atteindre 1 million de tokens. Cette capacité est idéale pour analyser d’importantes bases de code, de vastes collections documentaires ou pour des tâches longues à plusieurs étapes. Elle ne se limite pas à une simple fiche technique : dans la pratique, cela permettra aux développeurs et équipes de s’attaquer à des problématiques beaucoup plus vastes dans une seule interaction, notamment en automatisation, en audit documentaire, en analyse financière ou en programmation avancée.

GPT-5.4 marque aussi une avancée significative dans l’utilisation des ordinateurs. OpenAI le décrit comme son premier modèle à capacités natives pour manipuler directement des appareils et des logiciels. Il peut interagir avec des applications, des pages web, des environnements de bureau via des captures d’écran, du clavier et de la souris pour exécuter, valider ou corriger des tâches. Lors de tests comme OSWorld-Verified, un indicateur de performance pour ces interactions, GPT-5.4 atteint un taux de succès de 75,0 %, surpassant à la fois GPT-5.2 (47,3 %) et même la performance humaine de référence (72,4 %).

En matière de programmation, la puissance du modèle est également affirmée : GPT-5.4 égalise ou dépasse GPT-5.3-Codex sur SWE-Bench Pro avec un score de 57,7 %, tout en améliorant plusieurs indicateurs liés à l’utilisation d’outils et à la réalisation de tâches concrètes. OpenAI met également en avant ses compétences dans le développement front-end complexe, où il produit des résultats aussi esthétiques que fonctionnels. La présentation conjointe a même introduit une skill expérimentale appelée “Playwright (Interactive)”, conçue pour déboguer visuellement des applications web et Electron en cours de développement.

Un autre axe important concerne la recherche et la gestion d’outils. GPT-5.4 perfectionne son système de recherche d’outils grâce à tool search, permettant d’éviter de charger toutes les définitions d’un coup. Au lieu de surcharger le prompt avec des milliers de tokens, le modèle reçoit une liste légère, puis cherche la bonne fonction lorsque le besoin s’en fait sentir. Lors d’une évaluation portant sur 250 tâches avec 36 serveurs MCP, cette approche a réduit de 47 % l’utilisation globale de tokens sans compromis sur la précision. Ce progrès annonce des agents plus rapides, plus rentables et mieux adaptés à l’environnement professionnel complexe.

Enfin, la fiabilité fait aussi un pas en avant : OpenAI assure que GPT-5.4 est leur modèle le plus précis à ce jour. Sur un ensemble de prompts anonymisés où des erreurs factuelles avaient été signalées, ses affirmations étaient 33 % moins susceptibles d’être incorrectes que celles de GPT-5.2, et ses réponses complètes 18 % moins susceptibles de contenir des erreurs. Même si les hallucinations ne sont pas entièrement éradiquées, cela témoigne de leur effort constant pour répondre à une critique persistentielle des modèles génératifs.

Une des nouveautés majeures dans ChatGPT est ce qu’OpenAI appelle un préambule de raisonnement, intégré à GPT-5.4 Thinking. Il peut présenter dès le début un plan ou une stratégie pour gérer une requête complexe, permettant à l’utilisateur de corriger la trajectoire en cours de réponse sans devoir réinitialiser toute la conversation. OpenAI considère cette fonctionnalité comme un moyen de rendre le modèle plus contrôlable et plus utile pour des tâches de longue haleine. Elle est d’ores et déjà accessible en web, sur Android, et sera prochainement disponible sur iOS.

Globalement, GPT-5.4 ne se contente pas d’un simple saut générationnel. Il incarne une transition claire : de l’intelligence artificielle qui répond à celle qui travaille. Bien qu’il reste à tester en dehors des évaluations internes et benchmarks officiels, le message d’OpenAI est clair : l’avenir immédiat passe par des agents plus intelligents, capables de mieux comprendre, programmer, utiliser des outils avec discernement, traiter des documents réels et assurer la cohérence sur de longues séquences. GPT-5.4 devient dès aujourd’hui la pièce maîtresse de cette vision.

Questions fréquentes

Qu’est-ce que GPT-5.4 et pourquoi est-ce important pour les développeurs et les entreprises ?
GPT-5.4 est le nouveau modèle de référence d’OpenAI pour le travail professionnel, la programmation et les agents utilisant des outils. Son importance réside dans sa capacité à combiner raisonnement, génération de code, gestion de longs contextes, interaction avec des ordinateurs et une meilleure manipulation des documents, présentations et feuilles de calcul dans une plateforme unique.

Quelle différence entre GPT-5.4 Thinking et GPT-5.4 Pro dans ChatGPT ?
GPT-5.4 Thinking est la version intégrée dans ChatGPT pour les abonnés Plus, Teams et Pro, tandis que GPT-5.4 Pro vise les utilisateurs nécessitant une performance maximale pour des tâches très exigeantes. Elle est également disponible via l’API pour des charges de travail plus critiques.

À quoi sert une fenêtre de contexte d’un million de tokens dans GPT-5.4 ?
Elle permet d’analyser de vastes bases de code, de collections documentaires importantes ou des workflows longs avec plusieurs étapes, sans avoir à fragmenter l’information. Très utile pour l’automatisation, l’audit, la finance ou le développement avancé, cette capacité facilite la gestion d’informations complexes dans une seule interaction.

Quel est le tarif d’utilisation de GPT-5.4 via l’API d’OpenAI ?
Pour le plan standard avec jusqu’à 272 000 tokens, GPT-5.4 coûte 2,50 dollars par million de tokens d’entrée, 0,25 dollars pour les tokens en cache et 15 dollars par million de tokens sortants. La version Pro augmente à 30 dollars pour l’entrée et 180 dollars pour la sortie.

source : Noticias GPT 5.4