GB300 accélère DeepSeek dans un contexte longue durée : LMSYS mesure jusqu’à 1,53× plus de performance que GB200

La course à l’inférence ne se résume plus uniquement à « combien de tokens par seconde » une GPU peut traiter sur un prompt court. En 2026, le nouveau terrain de bataille est le contexte long : des modèles capables de lire des bases de code entières, de conserver une mémoire sur des flux agéntiques […]
Cloudflare lance « Markdown pour les Agents » : moins de tokens, plus de contexte et une nouvelle couche pour le web de l’intelligence artificielle

Cloudflare propose une idée simple avec des implications considérables pour tous ceux qui travaillent avec des modèles de langage : fournir une version en Markdown d’une page Web à la demande, sans modifier le site ni maintenir des “versions doubles”. La solution s’appelle Markdown for Agents et son efficacité peut être résumée par une statistique […]
Fortinet renforce FortiCNAPP : du « bruit » d’alertes à un risque cloud avec contexte réel

La sécurité dans le cloud a longtemps été confrontée à un problème persistant : ajouter davantage d’outils ne suffit pas. Trop d’alertes, un manque de contexte et des équipes qui finissent par privilégier ce qui « crie le plus » plutôt que ce qui expose réellement le business. Dans ce contexte, Fortinet a annoncé de […]
NVIDIA ouvre sa « pile » pour les agents IA avec Nemotron 3 : modèles ouverts, MoE hybride et un contexte de 1 000 000 de jetons

NVIDIA a franchi une étape qui s’attaque directement au cœur de la prochaine vague de logiciels : les systèmes multiagents. La société a annoncé Nemotron 3, une nouvelle famille de modèles ouverts — en tailles Nano, Super et Ultra — accompagnée de datasets et de librairies pour l’entraînement et le post-entraînement, avec un objectif clair […]
Slack ouvre sa plateforme à l’« IA avec contexte » : nouvelle API de recherche en temps réel et serveur MCP pour que les agents travaillent avec vos conversations (sans compromettre la gouvernance)

Slack, la plateforme de messagerie d’entreprise de Salesforce, souhaite devenir la couche de travail où résident — et sont réellement utiles — les agents d’IA. La société a présenté deux innovations techniques dans cette optique : une API de recherche en temps réel (RTS) et un serveur du Model Context Protocol (MCP). Ensemble, elles promettent […]
Grok 4 Fast : la mise de xAI qui relève GPT-5 et Claude Opus avec 2 millions de contexte et une vitesse extrême

La course à la tête du nouveau palmarès des modèles de langage ne se mesure plus uniquement par la précision, mais aussi par l’efficacité, le coût et la capacité de traitement du contexte. Sur ce terrain, xAI a lancé Grok 4 Fast, une version optimisée de sa série Grok 4 qui combine une fenêtre de […]
NVIDIA Rubin CPX : le GPU qui redéfinit l’inférence de contexte longue à l’ère de l’IA

L’inférence est devient le nouveau champ de bataille de l’intelligence artificielle. Les modèles actuels ne se contentent plus d’être de simples générateurs de texte ou d’images : ils évoluent vers des systèmes agéntiques capables de raisonner sur plusieurs étapes, de maintenir une mémoire persistante et de gérer des contextes de plusieurs millions de tokens. Pour […]
Le marché mondial des smartphones recule légèrement au deuxième trimestre 2025 face à un contexte économique incertain

Le marché mondial des smartphones a connu une légère baisse des expéditions au deuxième trimestre 2025, marquant ainsi la première diminution en six trimestres consécutifs de croissance. Selon le dernier rapport de Canalys, désormais intégré à Omdia, cette tendance à la baisse est attribuée à un contexte économique mondial incertain et à un refroidissement de […]
Jusqu’où se souviennent les modèles de langage ? Une analyse révèle la véritable capacité de contexte des LLM.

Concurrence pour étendre la fenêtre contextuelle des modèles de langage : une nouvelle étude remet en question les claims de performance Dans la bataille technique pour élargir la fenêtre contextuelle des modèles de langage, des entreprises éclairées telles qu’OpenAI, Google, Anthropic et Meta s’affrontent pour proposer des modèles capables de traiter une quantité croissante de […]
Gradient AI réussit à étendre le contexte de Llama 3 à plus d’un million de jetons

Gradient AI, une entreprise spécialisée dans l’intelligence artificielle, a réalisé une avancée importante dans le domaine du traitement du langage naturel en étendant le contexte des modèles Llama 3 de Meta à plus d’un million de tokens. Cette réussite positionne ces modèles comme ayant le contexte le plus large dans le domaine de l’open source. […]