NVIDIA Groq 3 LPX : le nouveau moteur pour l’inférence à faible latence

La grande course de l’IA ne se limite plus à la maîtrise de modèles de plus en plus gros. De plus en plus, le véritable goulet d’étranglement réside dans l’inférence: le temps nécessaire à un système pour commencer à répondre, la latence accumulée lorsque plusieurs agents interagissent et le coût pour maintenir cette rapidité à […]
Huawei présente ses SuperPoD au MWC 2026 : des clusters jusqu’à 8 192 NPU, une faible latence et un engagement en faveur de l’open source pour l’ère de l’IA

Lors du Mobile World Congress (MWC) 2026 de Barcelone, Huawei a mis en avant une idée centrale dans le débat technologique : l’avenir de la connectivité et de l’Intelligence Artificielle ne dépend pas uniquement de réseaux plus rapides, mais aussi de la construction de l’infrastructure informatique qui alimente des modèles toujours plus sophistiqués. Sa réponse […]
Fortinet et Arista présentent une architecture « prête pour l’IA » combinant réseau à faible latence et sécurité Zero Trust

Fortinet et Arista Networks ont annoncé une solution conjointe pour les centres de données axés sur l’Intelligence Artificielle, visant à résoudre l’un des principaux défis actuels : comment faire évoluer des clusters GPU sans que la sécurité ne devienne un frein… ni que le réseau se transforme en un point unique de défaillance. Cette proposition, […]
Samsung pousse la « mémoire à faible consommation » au centre de données avec SOCAMM2 : un changement silencieux ayant un impact sur les coûts

Depuis des années, la conversation sur l’Intelligence Artificielle dans les centres de données s’est concentrée sur l’évidence : GPUs, accélérateurs, réseaux à haute vitesse et systèmes de refroidissement capables de soutenir des racks qui ne fonctionnent plus seulement « par intermittence », mais en continu. Cependant, dans la réalité économique d’un déploiement d’IA — celle […]
NVIDIA se prépare à conquérir la Chine avec sa nouvelle puce B30 : un pari sur l’efficacité et le faible coût en IA

NVIDIA continue de renforcer sa présence sur le marché chinois de l’intelligence artificielle malgré les restrictions croissantes imposées par les États-Unis. Selon des sources exclusives relayées par le site Wccftech, l’entreprise de Santa Clara préparerait le lancement du Blackwell B30, une version adaptée et plus abordable de ses accélérateurs IA, conçue spécifiquement pour respecter les […]
Microsoft trébuche dans sa course pour défier NVIDIA dans les puces IA : retards et faible performance de sa puce Braga

Microsoft repousse la production de son premier chip d’intelligence artificielle jusqu’en 2026 Microsoft, un leader technologique engagé dans l’intelligence artificielle générative, fait face à des difficultés dans sa quête de réduire sa dépendance envers NVIDIA. Selon un récent rapport de The Information, le développement de son propre chip d’IA, codé nommé Braga, a subi un […]
L’anxiété de la batterie faible : comment éviter la dépendance au mobile et rester calme lorsque la charge est épuisée

Êtes-vous inquiet lorsque le niveau de batterie de votre smartphone descend en dessous de 30 % ? Vous n’êtes pas seul. Une étude récente réalisée aux États-Unis a révélé que la majorité des utilisateurs entre en état d’alerte lorsque leur appareil tombe en dessous de 38 % de charge. Ce phénomène, bien que trivial en […]
AWS mène la durabilité dans la construction de centres de données en Suède avec de l’acier à faible teneur en carbone

Amazon Web Services (AWS) a annoncé des avancées significatives dans la construction durable de ses nouveaux centres de données dans la région de Mälardalen, en Suède, dans le cadre de son expansion en Europe. La société utilise de l’acier à faible teneur en carbone et d’autres innovations technologiques pour réduire les émissions de carbone associées […]
Red Hat Device Edge optimise la faible latence et les charges de travail IA sur le edge avec sa dernière mise à jour

Red Hat, Inc., leader mondial des solutions open source, a annoncé le lancement de Red Hat Device Edge 4.17, une version qui introduit d’importantes améliorations pour gérer des charges de travail à délais critiques dans des emplacements éloignés et distribués. Cette mise à jour répond au besoin croissant de temps de réponse rapides et fiables, […]
Vertiv étend sa gamme de refroidisseurs pour centres de données avec une haute capacité et un réfrigérant à faible PRP

Vertiv (NYSE: VRT), fournisseur mondial de solutions d’infrastructure numérique critique, a annoncé aujourd’hui l’extension de sa gamme de refroidisseurs Vertiv™ Liebert® AFC, en intégrant des modèles de haute capacité qui utilisent un réfrigérant à faible potentiel de réchauffement global (GWP). Ces refroidisseurs sont spécifiquement conçus pour répondre aux demandes croissantes des centres de données à […]