Le refroidissement liquide au cœur des data centers IA

2025, l'année où la refroidissement liquide a cessé d'être « optionnel » dans les centres de données

Le refroidissement liquide n’est plus réservé aux superordinateurs et aux laboratoires. L’arrivée de racks équipés de dizaines de GPU, d’accélérateurs d’IA et de serveurs de plus en plus compacts impose une refonte partielle des centres de données, qui fonctionnaient depuis des années selon une logique plus simple : évacuer l’air, contrôler les couloirs froids et chauds, puis améliorer progressivement l’efficacité énergétique.

Ce modèle tient encore dans de nombreux contextes, mais ses limites deviennent apparentes. Les nouvelles plateformes d’IA augmentent la densité de puissance par rack, concentrent la chaleur au niveau de composants spécifiques et exigent une évacuation thermique plus directe. Cela ouvre un marché très vaste, avec une gamme étendue de fournisseurs : fabricants d’unités de distribution de refroidissement (CDUs), racks conçus pour le liquide, cold plates, pompes, vannes, tuyauteries, fluides diélectriques, échangeurs de chaleur, capteurs de fuite, automatisation et services d’intégration.

Du refroidissement par air au liquide : pourquoi les data centers changent

Pendant des années, le refroidissement par air a suffi pour la majorité des charges industrielles. Il reste efficace dans beaucoup de contextes de virtualisation, stockage, cloud privé, bases de données ou applications d’entreprise. Le changement s’impose quand des salles accueillent des racks à haute densité d’accélérateurs d’IA, où la chaleur générée par CPU, GPU, mémoire HBM et commutateurs internes dépasse ce que la conception traditionnelle peut évacuer.

Le refroidissement liquide ne désigne pas une seule technologie. La forme la plus répandue dans les nouvelles plateformes d’IA est le direct-to-chip : un cold plate placé directement sur la CPU ou le GPU, avec un circuit de liquide qui retire la chaleur. L’immersion consiste à plonger des serveurs ou composants dans des liquides diélectriques. Des solutions hybrides combinent air et liquide en fonction de la charge thermique.

Dans une installation moderne, il ne suffit pas d’acheter un serveur « prêt pour le liquide ». Il faut une architecture thermique complète. Les CDUs régulent débit, pression et transfert thermique entre le circuit IT et l’installation. Les manifolds et tuyauteries distribuent le liquide aux racks. Pompes, vannes et systèmes de contrôle maintiennent la circulation. Échangeurs de chaleur et refroidisseurs secs évacuent la chaleur. Détecteurs de fuite et monitoring minimisent les risques opérationnels.

À chaque niveau, des spécialistes différents interviennent. Vertiv, STULZ, Schneider Electric, nVent et Danfoss sont présents sur les CDUs. Dell, HPE, Lenovo, Supermicro et Wiwynn proposent des racks prêts pour le liquide. CoolIT Systems, Asetek et Rittal maîtrisent les cold plates. En fluides, 3M, Shell, Castrol, ExxonMobil, Chemours ou DuPont illustrent la diversité. Ce marché repose sur une chaîne de qualification très spécialisée, impliquant de nombreux fournisseurs distincts.

L’IA oblige à concevoir par rack, pas seulement par salle

La différence entre un data center classique et un data center prêt pour l’IA ne se limite pas à la puissance en mégawatts. Elle tient aussi à la distribution de cette puissance. Un bâtiment peut avoir une grande capacité électrique sans être adapté à des racks très denses sans un système de distribution, de refroidissement, de tuyauterie, de redondance, de capteurs et d’intégration au système de gestion.

Le NVIDIA GB200 NVL72 illustre bien cette évolution. La plateforme intègre 36 CPU Grace et 72 GPU Blackwell dans un rack refroidi par liquide. Ce type d’architecture porte la capacité de calcul IA à l’échelle d’un rack entier, pas d’un serveur, ce qui oblige à traiter énergie, réseau et refroidissement comme un système intégré. Dans cet environnement où NVIDIA parle désormais d’usines d’IA, le rack devient une plateforme thermique et électrique complète.

Pour les opérateurs, cela modifie des décisions fondamentales. Le refroidissement liquide peut améliorer l’efficacité, augmenter la densité et réduire la dépendance aux grands volumes d’air pulsé par ventilateurs. Mais il soulève aussi de nouvelles problématiques : compatibilité des matériaux, maintenance, gestion des fuites, qualité du fluide, connexions rapides, formation du personnel, pièces de rechange, monitoring et coordination entre fabricants de serveurs et infrastructure.

Les CDUs occupent une place centrale. Elles servent d’interface entre la partie informatique et l’infrastructure technique. Le liquide qui circule autour des serveurs n’est souvent pas identique à celui du système principal : cette séparation permet un meilleur contrôle de la pression, de la température, de la chimie du fluide et de la sécurité. Un problème dans un circuit ne compromet pas l’ensemble.

Les détecteurs de fuite jouent aussi un rôle clé. Dans un environnement où le liquide circule à proximité d’équipements critiques, la fiabilité dépend fortement de capteurs, alertes, vannes, procédures et d’une conception préventive. Des entreprises comme Vertiv, Raritan, Schneider Electric, nVent ou Emerson interviennent dans ce segment. La diffusion à grande échelle du refroidissement liquide dépendra de la capacité à le rendre maîtrisable et perçu comme sûr par les équipes opérationnelles.

Une opportunité industrielle, mais pas une solution universelle

Chaque nouveau cluster d’IA exige plus de densité, plus de refroidissement et une meilleure intégration. Cela crée des opportunités pour les fournisseurs d’ingénierie, fabricants de composants, intégrateurs, opérateurs de centres de données et spécialistes en maintenance. Cela renforce aussi les collaborations entre fabricants de serveurs, concepteurs de puces, sociétés de refroidissement et fournisseurs cloud.

Il faut garder les pieds sur terre. Le refroidissement liquide ne remplacera pas l’air dans tous les data centers. L’Uptime Institute rappelle que son déploiement reste progressif et que beaucoup d’installations utilisent encore principalement des systèmes traditionnels. La motivation principale vient des fortes densités par rack, pas d’une tendance universelle applicable à toutes les charges. Les accélérateurs de la prochaine génération, comme les puces d’inférence à 2 nm de FuriosaAI et Broadcom, vont accentuer ces exigences thermiques.

Un centre pourra continuer à utiliser des zones refroidies à l’air pour des charges classiques tout en réservant des zones liquides pour l’IA, le HPC ou les serveurs haute densité. Cette coexistence sera courante pendant plusieurs années. Et il n’est pas nécessaire de transformer entièrement une salle : une zone spécifique suffit pour accueillir de nouveaux racks.

La durabilité compte aussi. Le refroidissement liquide peut réduire la consommation électrique liée aux ventilateurs et améliorer les températures de fonctionnement. Mais il ne résout pas seul le coût énergétique de l’IA. Il oblige à reconsidérer la consommation d’eau, la composition des fluides, le traitement thermique et la récupération de chaleur. La performance réelle dépendra d’un design global, pas d’une simple certification commerciale.

Le refroidissement liquide dans les data centers IA, c’est une chaîne complète de conception, d’approvisionnement, d’exploitation et de services. Les opérateurs qui veulent accueillir la prochaine génération d’IA devront penser à la fois aux puces, au réseau et au stockage, mais aussi aux flux de liquide, aux échangeurs de chaleur, aux capteurs, aux fluides et à la formation du personnel qualifié.

Questions fréquentes

Qu’est-ce qu’une CDU en refroidissement liquide ?

Une CDU (Coolant Distribution Unit) contrôle le transfert thermique, le débit et la pression du liquide de refroidissement entre les racks IT et le système de refroidissement de l’installation.

Le refroidissement liquide va-t-il remplacer totalement l’air ?

Pas dans l’immédiat. La coexistence sera probablement la règle : l’air pour des charges standard, le refroidissement liquide pour les racks à forte densité, l’IA ou le HPC.

Quelle différence entre direct-to-chip et immersion ?

En direct-to-chip, le liquide circule dans des cold plates placés sur les composants. En immersion, les équipements sont plongés dans un fluide diélectrique qui absorbe la chaleur directement.

Pourquoi l’IA nécessite-t-elle plus de refroidissement liquide ?

Les accélérateurs d’IA concentrent beaucoup de puissance dans un espace réduit, augmentant la densité thermique par rack à un niveau que le seul refroidissement par air ne peut plus gérer efficacement.

le dernier