OpenAI mise sur Cerebras pour l’inférence rapide et réduire sa dépendance à NVIDIA

OpenAI et Cerebras : infrastructure d'inférence IA wafer-scale pour réduire la dépendance à NVIDIA

Vingt milliards de dollars sur trois ans : c’est l’ampleur de l’investissement qu’OpenAI envisagerait de consacrer à des serveurs équipés de puces Cerebras, selon des informations publiées par The Information et reprises par plusieurs médias financiers anglo-saxons. Si ces chiffres ne sont pas encore officiellement confirmés, ce qui l’est sans équivoque, c’est la direction stratégique […]

NVIDIA Groq 3 LPX : le nouveau moteur pour l’inférence à faible latence

NVIDIA renforce son engagement dans l'infrastructure IA avec BlueField-4 STX, une architecture de stockage conçue pour les agents et les contextes longs

La grande course de l’IA ne se limite plus à la maîtrise de modèles de plus en plus gros. De plus en plus, le véritable goulet d’étranglement réside dans l’inférence: le temps nécessaire à un système pour commencer à répondre, la latence accumulée lorsque plusieurs agents interagissent et le coût pour maintenir cette rapidité à […]

Huawei présente ses SuperPoD au MWC 2026 : des clusters jusqu’à 8 192 NPU, une faible latence et un engagement en faveur de l’open source pour l’ère de l’IA

Huawei présente ses SuperPoD au MWC 2026 : des clusters jusqu'à 8 192 NPU, une faible latence et un engagement en faveur de l’open source pour l’ère de l’IA

Lors du Mobile World Congress (MWC) 2026 de Barcelone, Huawei a mis en avant une idée centrale dans le débat technologique : l’avenir de la connectivité et de l’Intelligence Artificielle ne dépend pas uniquement de réseaux plus rapides, mais aussi de la construction de l’infrastructure informatique qui alimente des modèles toujours plus sophistiqués. Sa réponse […]

Fortinet et Arista présentent une architecture « prête pour l’IA » combinant réseau à faible latence et sécurité Zero Trust

Fortinet et Arista présentent une architecture « prête pour l'IA » combinant réseau à faible latence et sécurité Zero Trust

Fortinet et Arista Networks ont annoncé une solution conjointe pour les centres de données axés sur l’Intelligence Artificielle, visant à résoudre l’un des principaux défis actuels : comment faire évoluer des clusters GPU sans que la sécurité ne devienne un frein… ni que le réseau se transforme en un point unique de défaillance. Cette proposition, […]

F5 place le BIG-IP Next sur les DPU NVIDIA BlueField-4 pour des « usines d’IA » à l’échelle gigasque : plus de performance, moins de latence et sécurité zéro confiance

États-Unis sous la loupe : la Malaisie multiplie par 34 ses importations de GPU en pleine guerre technologique avec la Chine

F5 (NASDAQ : FFIV) a annoncé l’expansion de BIG-IP Next for Kubernetes avec les nouvelles NVIDIA BlueField-4 DPU, ciblant les usines d’IA à l’échelle gigascale. Cette combinaison promet jusqu’à 800 Gb/s de réseau multi-locataire avec contrôle intelligent, des améliorations en sécurité zero-trust et une accélération des charges LLM (inférence), ce qui, selon F5, se traduit […]

Bifrost est prêt : le nouveau câble sous-marin reliant Singapour et la côte ouest des États-Unis entre en service et redéfinit la latence transpacífica

Bifrost est prêt : le nouveau câble sous-marin reliant Singapour et la côte ouest des États-Unis entre en service et redéfinit la latence transpacífica

Le système de câbles Bifrost a officiellement obtenu le statut Prêt pour le Service (RFS) et commencera à traiter du trafic commercial dans les prochaines semaines. Ce n’est pas un câble ordinaire : il s’agit du premier système sous-marin au monde reliant directement Singapour à la côte ouest des États-Unis via l’Indonésie — à travers […]