Inference | Actualite Cloud

UC San Diego renforce sa recherche en inférence de LLM avec un système NVIDIA DGX B200

La course à la mise en service de modèles de langage à faible latence ne se résume plus seulement à des articles et des benchmarks : de plus en plus, la victoire se joue dans le laboratoire de systèmes, où le goulet d’étranglement réside souvent dans la façon dont le modèle est « servi » […]

Red Hat et Rebelles apportent les NPU à OpenShift AI pour favoriser une inférence plus efficace en entreprise

Red Hat allie innovation et stabilité dans la dernière version de Red Hat OpenShift

La course à la déploiement de l’Intelligence Artificielle en production ne se résume pas seulement au choix du modèle. De plus en plus, la discussion s’oriente vers l’infrastructure : quel est le coût de la mise en service d’un modèle, sa consommation énergétique, la gestion à grande échelle, et le niveau de contrôle et conformité […]

Google lance Ironwood (TPU v7) et de nouvelles VM Axion : inférence à l’échelle mondiale et réduction des coûts

Google Cloud a dévoilé Ironwood, sa septième génération de TPU, accompagnée de nouvelles instances Axion basées sur ARM Neoverse — N4A (en avant-première) et C4A métal (bare metal ARM, « prochainement » en aperçu) —, marquant ainsi un changement de cycle dans le domaine de l’Intelligence Artificielle : un déplacement du focus du entraînement vers […]

Akamai lance Inference Cloud avec NVIDIA : inférence IA distribuée du cœur au bord pour l’ère des agents et de la Physique IA

Rapport sur les ransomwares 2025 : Résilience dans un paysage de menaces alimenté par l'IA

Akamai a présenté Inference Cloud, une plateforme conçue pour faire passer l’inférence de l’IA des centres de données centraux jusqu’au périmètre d’Internet, afin d’offrir faible latence, sécurité et évolutivité mondiale pour des applications d’IA agentique et de Physical AI (robots, véhicules, villes intelligentes). La solution exploite l’infrastructure NVIDIA Blackwell et le réseau mondial distribué d’Akamai […]

IBM et Groq s’associent pour mettre l’IA générative en production : watsonx Orchestrate ajoutera une inférence « ultrarapide » via LPU et GroqCloud

IBM et Groq ont annoncé une alliance stratégique en marketing et technologie, avec un objectif clair : permettre aux entreprises de passer des pilotes à la production en IA agentique, sans rencontrer les obstacles habituels liés à la latence, au coût et à l’échelle. L’accord intègre GroqCloud — la plateforme d’inférence accélérée par la LPU […]

Akamai Inference Cloud transforme l’IA du centre à l’Edge avec NVIDIA

Akamai Technologies, Inc. (NASDAQ : AKAM) a lancé Akamai Inference Cloud, une plateforme innovante qui bouleverse la manière et l’endroit où l’intelligence artificielle est déployée, en étendant les processus d’inférence des centres de données traditionnels jusqu’au front (Edge) d’Internet. Cette solution permet d’effectuer des inférences IA avancées et autonomes directement à la périphérie (Edge), c’est-à-dire […]

NVIDIA renforce sa domination en IA : Blackwell atteint une marge de 78 % en inférence et devance AMD

Nvidia résout les problèmes de conception de Blackwell et commencera à expédier les nouveaux GPU

Une nouvelle étude de Morgan Stanley Research a quantifié l’activité de l’inférence en intelligence artificielle, confirmant ce que le marché pressentait : NVIDIA conserve un avantage colossal sur ses concurrents, non seulement en puissance hardware mais aussi en rentabilité commerciale. L’analyse utilise un modèle standard simulant une « usine d’inférence IA » de 100 MW, […]

Akamai étend son offre d’IA avec le lancement d’Akamai Cloud Inference

Akamai, entreprise de cybersécurité et de cloud computing, a annoncé le lancement de Akamai Cloud Inference, marquant ainsi le début d’une nouvelle ère d’innovation plus rapide et efficace pour les organisations cherchant à transformer les modèles prédictifs et les modèles de langage étendus (LLMs) en réalité. Akamai Cloud Inference fonctionne sur l’Akamai Cloud, le réseau […]