Cerebras défie NVIDIA sur la vitesse d’inférence

Cerebras remet sur la table une question gênante pour l’industrie de l’IA : et si le problème ne résidait pas dans le nombre de GPU, mais dans une dépendance excessive à une architecture conçue à l’origine pour d’autres types de charges ? Andrew Feldman, cofondateur et CEO de Cerebras, défend depuis longtemps cette thèse : […]
Akamai lance AI Brand Presence : gérer sa visibilité dans la recherche agentique

Akamai a lancé AI Brand Presence, une solution conçue pour aider les entreprises à adapter leur présence numérique à un contexte de recherche dominé par l’IA. Le produit optimise le contenu pour les grands modèles de langage et les agents d’IA, surveille le trafic automatisé et renforce la sécurité à l’edge. Un lancement qui répond […]
Gemini 3.5 Flash : Google redéfinit la course IA sur le terrain des agents

Google DeepMind a dévoilé Gemini 3.5 Flash, portant un message clair pour le marché technologique : la prochaine étape de l’intelligence artificielle se jouera au niveau des agents intelligents. Fini le temps où répondre correctement dans une conversation était l’étalon de mesure. Les nouveaux modèles doivent agir, intégrer des outils, consulter des données, exécuter des […]
Passer de consommer des tokens à en produire : le nouveau défi économique de l’IA d’entreprise

Les modèles de raisonnement consomment entre 10 et 20 fois plus de tokens que les modèles standard pour traiter un même problème. Quand les agents IA enchainent des tâches et utilisent des outils de façon autonome, ce chiffre grimpe encore. Pour les DSI et les directeurs techniques, le problème n’est plus de savoir si adopter […]
QNAP lance QAI-h1290FX, un serveur edge pour l’IA privée en entreprise

QNAP vient de dévoiler le QAI-h1290FX, un serveur conçu pour faire tourner en local des charges d’IA générative (LLM, RAG, génération d’images, automatisation) sans dépendre du cloud. La machine associe stockage all-flash NVMe sur douze baies U.2, processeur AMD EPYC 7302P (16 cœurs, 32 threads), support GPU NVIDIA RTX et le système QuTS hero basé […]
Cloudflare et Wiz : une alliance pour sécuriser l’IA en entreprise

La multiplication des déploiements d’intelligence artificielle en entreprise dépasse la capacité de contrôle des équipes de sécurité. Chaque chatbot, copilote ou endpoint basé sur l’IA représente un vecteur d’attaque potentiel — vulnérable à l’injection d’instructions malveillantes, à la fuite de données sensibles ou à un usage non contrôlé. Cloudflare et Wiz (désormais intégré à Google […]
Anthropic et CoreWeave : un accord pluriannuel pour Claude dans le cloud IA

Anthropic a conclu un accord pluriannuel avec CoreWeave pour utiliser son infrastructure cloud dans le développement et le déploiement de la famille de modèles Claude. CoreWeave a confirmé que la capacité contractée commencera à être déployée plus tard cette année. Anthropic possède déjà un partenariat stratégique avec Amazon (8 milliards investis, AWS comme fournisseur cloud […]
Citrix NetScaler AI Gateway : gouvernance et coûts de l’IA en entreprise

Citrix a présenté NetScaler AI Gateway, une couche de gouvernance dédiée aux applications d’IA. L’objectif : maîtriser coûts, performance et sécurité lors des déploiements de LLM et flux agentiques. De nombreuses entreprises sont passées de l’expérimentation à la production sans que leurs infrastructures ne gèrent le volume de trafic, les coûts par token ou les […]
Meta Muse Spark : la réponse stratégique face à OpenAI et Google

Meta a présenté Muse Spark, premier modèle de la famille Muse de Meta Superintelligence Labs. Modèle multimodal de raisonnement avec outils, chaîne de pensée visuelle et orchestration multi-agent. Déjà déployé sur meta.ai et dans l’app Meta AI, avec API privée pour partenaires. Bientôt sur WhatsApp, Instagram, Facebook, Messenger et lunettes IA. Ce lancement s’accompagne d’une […]
Anthropic Mythos : l’IA offensive devient une affaire industrielle

Anthropic conserve Claude Mythos en accès fermé via Project Glasswing réunissant Apple, Google, Microsoft, NVIDIA, CrowdStrike et Palo Alto Networks. L’IA offensive passe du laboratoire à l’industrie. Mythos est trop puissant en sécurité offensive pour une diffusion large. Ce positionnement complète l’entrée d’OpenAI et Anthropic en cybersécurité et le partenariat Anthropic-CoreWeave pour Claude. Questions fréquentes […]