OpenAI lance GPT-4.1 : de nouveaux modèles plus rapides, précis et adaptables pour l’ère de l’intelligence artificielle

OpenAI lance GPT-4.1 : de nouveaux modèles plus rapides, précis et adaptables pour l'ère de l'intelligence artificielle

OpenAI dévoile GPT‑4.1, mini et nano : trois modèles élargissant les possibilités de développement logiciel

OpenAI a officially announced the new family of language models GPT‑4.1, a technical evolution that enhances its systems’ capabilities to tackle complex programming tasks, follow instructions more accurately, and process large volumes of natural and multimodal language context.

Cette nouvelle série inclut, pour la première fois, les modèles GPT‑4.1 mini et GPT‑4.1 nano, conçus pour des cas d’utilisation avec des limitations de latence ou de budget. Ce lancement marque également le début du retrait progressif de GPT‑4.5 Preview, qui ne sera plus disponible sur l’API d’OpenAI à partir du 14 juillet 2025.

Avancées clés en programmation, instructions et contexte

Parmi les principales améliorations de la série GPT‑4.1, on trouve :

  • Capacité de codage sans précédent : le modèle principal atteint une précision de 54,6 % sur le benchmark SWE-bench Verified, surclassant largement GPT‑4o (33,2 %) et GPT‑4.5 (38 %). Il est particulièrement efficace pour l’édition de code, la génération de diffs et l’utilisation précise d’outils.

  • Meilleur suivi des instructions complexes : GPT‑4.1 enregistre une amélioration de 10,5 % par rapport à GPT‑4o sur le benchmark MultiChallenge, ce qui en fait un outil plus fiable pour les développeurs et les agents conversationnels.

  • Compréhension de contexte long jusqu’à 1 million de tokens : un chiffre record permettant d’analyser des bases de données juridiques, des documents financiers étendus ou de grands dépôts de code. La récupération d’informations dispersées et le raisonnement multi-hop dans de longs textes ont également été améliorés.

  • Améliorations visuelles et multimodales : notamment dans GPT‑4.1 mini, qui surpasse GPT‑4o dans des tâches combinant texte et image.

Trois modèles, trois solutions

Modèle Limite de contexte Avantages principaux Prix par 1M tokens
GPT‑4.1 1 million Précision maximale et capacité générale 2,00 $ entrée / 8,00 $ sortie
GPT‑4.1 mini 1 million Rapide, économique, performance élevée 0,40 $ / 1,60 $
GPT‑4.1 nano 1 million Ultra rapide, idéal pour tâches légères 0,10 $ / 0,40 $

Le modèle nano se distingue comme le modèle le plus rapide et efficace développé par OpenAI à ce jour, idéal pour des tâches telles que la classification, l’autocomplétion ou l’extraction d’entités en temps réel. Selon l’entreprise, il réduit également le coût de 83 % par rapport à GPT‑4o mini.

Cas d’utilisation réels et tests en entreprise

Des entreprises telles que Thomson Reuters, Blue J ou Carlyle ont testé GPT‑4.1 pour valider ses améliorations. Blue J, spécialisée dans les solutions fiscales basées sur l’IA, a observé une amélioration de 53 % en précision en passant de GPT‑4o à GPT‑4.1.

Thomson Reuters a quant à elle connu une amélioration de 17 % dans l’analyse juridique multifuente, essentielle pour l’automatisation des tâches juridiques complexes. Carlyle a utilisé le modèle pour extraire des informations financières détaillées de documents longs, incluant des PDF et des feuilles de calcul, avec une amélioration de 50 % en précision.

Remises et améliorations de l’API

OpenAI a augmenté le rabais sur le cache de prompt à 75 %, permettant d’accélérer les réponses pour des tâches répétitives. De plus, les nouvelles versions mini et nano sont proposées à des prix réduits en mode par lots (Batch API).

Avec GPT‑4.1, OpenAI renforce sa position de leader dans le domaine des modèles de langage et établit un nouveau standard pour les développeurs, chercheurs et entreprises à la recherche de solutions puissantes, évolutives et rentables pour leurs applications intelligentes.

Source : Actualités intelligence artificielle

le dernier