LLM | Actualite Cloud

Cerebras défie NVIDIA sur la vitesse d’inférence

OpenAI regarde Cerebras pour renforcer sa puissance d'inférence et réduire sa dépendance à d'autres fournisseurs

Cerebras remet sur la table une question gênante pour l’industrie de l’IA : et si le problème ne résidait pas dans le nombre de GPU, mais dans une dépendance excessive à une architecture conçue à l’origine pour d’autres types de charges ? Andrew Feldman, cofondateur et CEO de Cerebras, défend depuis longtemps cette thèse : […]

Akamai lance AI Brand Presence : gérer sa visibilité dans la recherche agentique

Akamai a lancé AI Brand Presence, une solution conçue pour aider les entreprises à adapter leur présence numérique à un contexte de recherche dominé par l’IA. Le produit optimise le contenu pour les grands modèles de langage et les agents d’IA, surveille le trafic automatisé et renforce la sécurité à l’edge. Un lancement qui répond […]

Gemini 3.5 Flash : Google redéfinit la course IA sur le terrain des agents

Abstract visualization of AI agents and multi-step workflows: interconnected nodes and data flows forming a complex networ...

Google DeepMind a dévoilé Gemini 3.5 Flash, portant un message clair pour le marché technologique : la prochaine étape de l’intelligence artificielle se jouera au niveau des agents intelligents. Fini le temps où répondre correctement dans une conversation était l’étalon de mesure. Les nouveaux modèles doivent agir, intégrer des outils, consulter des données, exécuter des […]

Passer de consommer des tokens à en produire : le nouveau défi économique de l’IA d’entreprise

L'écosystème de canal comme élément clé pour capitaliser l'investissement dans l'IA

Les modèles de raisonnement consomment entre 10 et 20 fois plus de tokens que les modèles standard pour traiter un même problème. Quand les agents IA enchainent des tâches et utilisent des outils de façon autonome, ce chiffre grimpe encore. Pour les DSI et les directeurs techniques, le problème n’est plus de savoir si adopter […]

QNAP lance QAI-h1290FX, un serveur edge pour l’IA privée en entreprise

QNAP vient de dévoiler le QAI-h1290FX, un serveur conçu pour faire tourner en local des charges d’IA générative (LLM, RAG, génération d’images, automatisation) sans dépendre du cloud. La machine associe stockage all-flash NVMe sur douze baies U.2, processeur AMD EPYC 7302P (16 cœurs, 32 threads), support GPU NVIDIA RTX et le système QuTS hero basé […]

Cloudflare et Wiz : une alliance pour sécuriser l’IA en entreprise

Cloudflare et Wiz annoncent leur partenariat en matière de sécurité basé sur l'intelligence artificielle

La multiplication des déploiements d’intelligence artificielle en entreprise dépasse la capacité de contrôle des équipes de sécurité. Chaque chatbot, copilote ou endpoint basé sur l’IA représente un vecteur d’attaque potentiel — vulnérable à l’injection d’instructions malveillantes, à la fuite de données sensibles ou à un usage non contrôlé. Cloudflare et Wiz (désormais intégré à Google […]

Anthropic et CoreWeave : un accord pluriannuel pour Claude dans le cloud IA

CoreWeave valide le "Platinum ClusterMAX™" de SemiAnalysis : ce qui se cache derrière la performance qui la couronne comme le cloud d'IA numéro 1

Anthropic a conclu un accord pluriannuel avec CoreWeave pour utiliser son infrastructure cloud dans le développement et le déploiement de la famille de modèles Claude. CoreWeave a confirmé que la capacité contractée commencera à être déployée plus tard cette année. Anthropic possède déjà un partenariat stratégique avec Amazon (8 milliards investis, AWS comme fournisseur cloud […]

Citrix NetScaler AI Gateway : gouvernance et coûts de l’IA en entreprise

Citrix lance NetScaler AI Gateway pour organiser, gérer les coûts et sécuriser le trafic d'IA en entreprise

Citrix a présenté NetScaler AI Gateway, une couche de gouvernance dédiée aux applications d’IA. L’objectif : maîtriser coûts, performance et sécurité lors des déploiements de LLM et flux agentiques. De nombreuses entreprises sont passées de l’expérimentation à la production sans que leurs infrastructures ne gèrent le volume de trafic, les coûts par token ou les […]

Meta Muse Spark : la réponse stratégique face à OpenAI et Google

Meta joue sa carte avec Muse Spark et redéfinit sa stratégie face à OpenAI et Google

Meta a présenté Muse Spark, premier modèle de la famille Muse de Meta Superintelligence Labs. Modèle multimodal de raisonnement avec outils, chaîne de pensée visuelle et orchestration multi-agent. Déjà déployé sur meta.ai et dans l’app Meta AI, avec API privée pour partenaires. Bientôt sur WhatsApp, Instagram, Facebook, Messenger et lunettes IA. Ce lancement s’accompagne d’une […]

Anthropic Mythos : l’IA offensive devient une affaire industrielle

Anthropic conserve Mythos et transforme l'IA offensive en une affaire industrielle

Anthropic conserve Claude Mythos en accès fermé via Project Glasswing réunissant Apple, Google, Microsoft, NVIDIA, CrowdStrike et Palo Alto Networks. L’IA offensive passe du laboratoire à l’industrie. Mythos est trop puissant en sécurité offensive pour une diffusion large. Ce positionnement complète l’entrée d’OpenAI et Anthropic en cybersécurité et le partenariat Anthropic-CoreWeave pour Claude. Questions fréquentes […]