latence | Actualite Cloud

OpenAI mise sur Cerebras pour l’inférence rapide et réduire sa dépendance à NVIDIA

OpenAI et Cerebras : infrastructure d'inférence IA wafer-scale pour réduire la dépendance à NVIDIA

Vingt milliards de dollars sur trois ans : c’est l’ampleur de l’investissement qu’OpenAI envisagerait de consacrer à des serveurs équipés de puces Cerebras, selon des informations publiées par The Information et reprises par plusieurs médias financiers anglo-saxons. Si ces chiffres ne sont pas encore officiellement confirmés, ce qui l’est sans équivoque, c’est la direction stratégique […]

NVIDIA Groq 3 LPX : le nouveau moteur pour l’inférence à faible latence

NVIDIA renforce son engagement dans l'infrastructure IA avec BlueField-4 STX, une architecture de stockage conçue pour les agents et les contextes longs

La grande course de l’IA ne se limite plus à la maîtrise de modèles de plus en plus gros. De plus en plus, le véritable goulet d’étranglement réside dans l’inférence: le temps nécessaire à un système pour commencer à répondre, la latence accumulée lorsque plusieurs agents interagissent et le coût pour maintenir cette rapidité à […]

Huawei présente ses SuperPoD au MWC 2026 : des clusters jusqu’à 8 192 NPU, une faible latence et un engagement en faveur de l’open source pour l’ère de l’IA

Lors du Mobile World Congress (MWC) 2026 de Barcelone, Huawei a mis en avant une idée centrale dans le débat technologique : l’avenir de la connectivité et de l’Intelligence Artificielle ne dépend pas uniquement de réseaux plus rapides, mais aussi de la construction de l’infrastructure informatique qui alimente des modèles toujours plus sophistiqués. Sa réponse […]

Starlink contre la fibre optique : laquelle choisir, comment fonctionne chacune et à quoi s’attendre en termes de latence et de vitesse

Starlink : le géant de l'espace qui pourrait révolutionner la géolocalisation mondiale avec son propre GPS

La comparaison entre Starlink et la fibre optique (FTTH) ne se limite plus à un débat “rural contre urbain”. Avec la hausse du télétravail, du jeu en ligne et de la consommation de vidéos 4K, de plus en plus de ménages et d’entreprises se posent la même question : Une connexion satellite moderne en vaut-elle […]

Pogocache : le cache qui parle Redis, Memcache et HTTP et vise la latence minimale – Revue Cloud

Dans le monde de l’infrastructure, les tendances changent, mais les besoins restent souvent les mêmes : moins de latence, moins de CPU par requête et moins de surprises en production. Sur ce terrain — où Redis, Memcached, Valkey ou Dragonfly sont depuis des années des noms familiers — un nouveau venu commence à faire du […]

Fortinet et Arista présentent une architecture « prête pour l’IA » combinant réseau à faible latence et sécurité Zero Trust

Fortinet et Arista Networks ont annoncé une solution conjointe pour les centres de données axés sur l’Intelligence Artificielle, visant à résoudre l’un des principaux défis actuels : comment faire évoluer des clusters GPU sans que la sécurité ne devienne un frein… ni que le réseau se transforme en un point unique de défaillance. Cette proposition, […]

Coreo bloque le « point mort » du DDoS chiffré : blocages L7 en temps réel sans ajouter de latence ni d’infrastructure

L'Internet Archive subit une attaque et expose les données de 31 millions d'utilisateurs

Corero Network Security (BM: CNS ; OTCQX : DDOSF) a annoncé une nouvelle capacité de SmartWall ONE permettant de stopper en temps réel les attaques DDoS de couche applicative (L7) sur du trafic chiffré, sans ajouter de latence ni nécessiter d’infrastructures supplémentaires. La société cible ainsi l’un des défauts les plus critiques de la défense […]

F5 place le BIG-IP Next sur les DPU NVIDIA BlueField-4 pour des « usines d’IA » à l’échelle gigasque : plus de performance, moins de latence et sécurité zéro confiance

F5 (NASDAQ : FFIV) a annoncé l’expansion de BIG-IP Next for Kubernetes avec les nouvelles NVIDIA BlueField-4 DPU, ciblant les usines d’IA à l’échelle gigascale. Cette combinaison promet jusqu’à 800 Gb/s de réseau multi-locataire avec contrôle intelligent, des améliorations en sécurité zero-trust et une accélération des charges LLM (inférence), ce qui, selon F5, se traduit […]

Muon Space se connecte à Starlink : satellites LEO « toujours allumés » avec lasers de 25 Gb/s et latence en millisecondes

Muon Space intégrera les mini terminales laser Starlink dans sa plateforme satellitaire Halo™, transformant ainsi ses satellites en nœuds de réseau en temps réel au sein du maillage optique mondial de SpaceX. La promesse : des liens optiques jusqu’à 25 Gb/s sur des distances allant jusqu’à 4 000 km, une latence en millisecondes vers des […]

Bifrost est prêt : le nouveau câble sous-marin reliant Singapour et la côte ouest des États-Unis entre en service et redéfinit la latence transpacífica

Le système de câbles Bifrost a officiellement obtenu le statut Prêt pour le Service (RFS) et commencera à traiter du trafic commercial dans les prochaines semaines. Ce n’est pas un câble ordinaire : il s’agit du premier système sous-marin au monde reliant directement Singapour à la côte ouest des États-Unis via l’Indonésie — à travers […]