CoreWeave Blackwell : le challenger du cloud IA defie AWS, Azure et GCP

CoreWeave Blackwell : salle serveurs GPU NVIDIA GB200 NVL72 pour le cloud IA

CoreWeave vient de franchir un seuil qui change la donne sur le marche du cloud IA. L’operateur americain a mis en production des milliers de GPU NVIDIA Blackwell via sa plateforme rack-scale GB200 NVL72, devenant ainsi le premier fournisseur a deployer a grande echelle l’architecture la plus avancee de NVIDIA pour l’entrainement et l’inference. Avec Cohere, IBM et Mistral AI comme premiers clients confirmes, CoreWeave Blackwell n’est plus une annonce marketing mais une realite industrielle, qui bouscule frontalement le trio AWS, Microsoft Azure et Google Cloud.

Cette mise en production n’est pas anecdotique. Elle materialise un basculement strategique du marche : la competition cloud IA ne se joue plus sur le catalogue GPU, mais sur la capacite a livrer des usines d’IA completes, preintegrees et pretes a industrialiser des modeles de plusieurs centaines de milliards de parametres. CoreWeave, valorise plus de 70 milliards de dollars apres son IPO de mars 2025, s’impose comme le challenger le plus credible face aux hyperscalers traditionnels.

Le deploiement Blackwell : la premiere usine d’IA rack-scale a grande echelle

Le coeur de l’annonce tient en quatre lettres et deux chiffres : GB200 NVL72. Il ne s’agit pas d’une simple instance GPU de plus dans le catalogue, mais d’une plateforme rack-scale integree qui redefinit la notion meme de serveur IA. Chaque rack connecte 72 GPU Blackwell et 36 CPU Grace dans un domaine NVLink unifie, avec une bande passante inter-GPU sans commune mesure avec les architectures Hopper de generation precedente. Le tout est interconnecte via des reseaux NVIDIA Quantum-2 InfiniBand capables de faire evoluer le cluster jusqu’a 110 000 GPU selon la documentation officielle de CoreWeave.

GB200 NVL72 : la rupture architecturale qui fait la difference

Ce qui distingue GB200 NVL72 des generations precedentes, c’est la memoire unifiee et la topologie reseau. Dans un rack Blackwell, les 72 GPU partagent un espace memoire coherent, ce qui elimine les goulots d’etranglement inter-nodes qui plombaient l’entrainement des modeles ultra-larges. Pour un modele dense de 100 milliards de parametres, Cohere rapporte jusqu’a trois fois plus de performance qu’avec une infrastructure Hopper equivalente, meme sans optimisations specifiques au nouveau silicium. Mistral AI, de son cote, signale un facteur 2x sur l’entrainement de modeles denses, immediatement apres deploiement, selon les chiffres releves par NVIDIA.

Capacite et sites : milliers de GPU en production effective

CoreWeave exploite aujourd’hui plusieurs milliers de GPU GB200 repartis sur ses sites americains, avec une expansion europeenne en cours pour repondre a la demande francaise, allemande et britannique. La societe annonce disposer de la capacite rack-scale la plus dense du marche non-hyperscaler, avec des deploiements dedies a l’entrainement massif (Cohere, Mistral) et des clusters orientes inference haute frequence. Les resultats de CoreWeave au benchmark MLPerf Inference positionnent d’ailleurs la societe devant la plupart des operateurs cloud sur les charges Grace Blackwell, un indicateur que NVIDIA met en avant pour valider le choix de l’operateur comme partenaire de lancement privilegie.

Qui est CoreWeave : de mineur Ethereum a hyperscaler IA

L’histoire de CoreWeave est l’une des trajectoires les plus atypiques de la tech contemporaine. Fondee en 2017 par trois traders de matieres premieres, Michael Intrator, Brian Venturo et Brannin McBee, la societe a d’abord construit son parc GPU pour le minage de cryptomonnaies. L’effondrement du cours d’Ethereum en 2018, puis la transition vers le proof-of-stake, ont force un pivot strategique qui s’est revele visionnaire : reconvertir les dizaines de milliers de GPU deja deployes vers le calcul intensif pour la recherche scientifique, le rendu 3D, puis l’IA generative.

Le tournant definitif arrive en 2022-2023 avec l’explosion des grands modeles de langage. CoreWeave devient l’un des rares fournisseurs capables de livrer rapidement des clusters NVIDIA H100 a Microsoft, OpenAI, Meta et Stability AI. Le partenariat strategique noue avec NVIDIA en 2023, qui inclut un investissement direct du fondeur dans le capital de CoreWeave, consacre la societe comme launch partner pour chaque nouvelle architecture GPU. C’est exactement ce mecanisme qui explique la precocite du deploiement Blackwell aujourd’hui.

L’IPO de mars 2025 au Nasdaq, malgre un demarrage en demi-teinte, a valorise l’entreprise a plus de 70 milliards de dollars en sommet de cotation, un multiple qui traduit la conviction du marche : CoreWeave n’est pas un simple revendeur de capacite GPU, mais un acteur d’infrastructure comparable aux hyperscalers, specialise exclusivement sur la charge IA. La societe revendique 470 000 GPU deployes fin 2025, un chiffre qui la place devant la plupart des operateurs cloud europeens reunis.

Les clients et partenariats : OpenAI, Microsoft, Meta, IBM et Mistral

Le portefeuille clients de CoreWeave ressemble a un annuaire des leaders de l’IA. Microsoft represente historiquement la part la plus importante du chiffre d’affaires, avec un contrat pluriannuel estime a 10 milliards de dollars signe en 2023, etendu en 2024 pour absorber une partie des besoins d’OpenAI lorsque Azure arrivait en sature. OpenAI a ensuite signe en direct avec CoreWeave en mars 2025 un contrat de 11,9 milliards de dollars sur cinq ans, auquel s’est ajoutee une rallonge de 4 milliards en mai. La strategie d’OpenAI consistant a diversifier ses fournisseurs d’inference vers des alternatives comme Cerebras ne remet d’ailleurs pas en cause cette dependance structurelle a CoreWeave pour l’entrainement.

Meta a rejoint le portefeuille en 2024 avec un contrat pluriannuel pour l’entrainement de Llama et la recherche FAIR. IBM, longtemps partenaire discret, s’est publiquement engage en janvier 2025 lors de l’annonce du superordinateur Blackwell co-construit par les deux societes, destine a entrainer la prochaine generation de modeles Granite. La particularite du contrat IBM reside dans l’integration de son Storage Scale System, une couche de stockage haute performance qui complete l’offre reseau-compute de CoreWeave. Anthropic, bien qu’ayant privilegie AWS Trainium et Google TPU, explore activement le marche de l’energie et des centres de donnees et pourrait rejoindre le portefeuille a moyen terme.

Cote francais, Mistral AI constitue le client europeen phare. La startup parisienne a recu ses premiers milliers de GPU Blackwell pour accelerer l’entrainement de ses modeles ouverts, dans le cadre d’une relation commerciale qui precede l’arrivee de GB200 NVL72. Pour Mistral, CoreWeave represente un acces privilegie a la capacite GPU sans dependre directement des hyperscalers americains, un positionnement crucial dans le contexte de souverainete numerique europeenne.

L’avantage technique face aux hyperscalers : velocite et proximite NVIDIA

Face a AWS, Azure et Google Cloud, CoreWeave joue deux cartes structurelles : la velocite de deploiement et la proximite absolue avec NVIDIA. La societe est systematiquement la premiere a proposer la disponibilite generale des nouvelles architectures GPU, avec un delai de six a douze mois d’avance sur les hyperscalers. Ce phenomene s’explique par l’architecture meme de CoreWeave : aucune contrainte de compatibilite avec un catalogue cloud historique, aucune negociation interne entre divisions, et une equipe technique entierement dediee au deploiement rack-scale NVIDIA. La feuille de route Blackwell et Rubin de NVIDIA se traduit chez CoreWeave par un deploiement quasi immediat, la ou AWS ou Azure doivent attendre la certification, la validation logicielle et l’harmonisation avec leurs services manages.

Le second avantage est tarifaire et contractuel. CoreWeave propose des engagements de capacite reservee a des prix sensiblement inferieurs aux tarifs on-demand des hyperscalers, en contrepartie d’engagements pluriannuels. Pour un laboratoire qui entraine un modele pendant six a dix-huit mois, le TCO est generalement 30 a 50 pour cent plus bas qu’une solution Azure ou AWS equivalente. A cela s’ajoute une flexibilite operationnelle superieure : acces bare metal, configuration reseau personnalisable, integration directe avec Kubernetes sans couche d’abstraction proprietaire.

La contrepartie est un ecosysteme de services manages quasi inexistant. CoreWeave ne propose pas de base de donnees serverless, de queue managee ou de data lakehouse. Pour un grand compte qui cherche une plateforme cloud generaliste, l’offre reste incomparable a celle d’AWS ou GCP. Mais pour un laboratoire IA ou un editeur SaaS qui a besoin uniquement de capacite GPU pure, le rapport performance-prix est imbattable.

Les risques : concentration client, financement et energie

Le modele CoreWeave presente trois vulnerabilites structurelles qui meritent une analyse serieuse. La premiere est la concentration client extreme. Microsoft et OpenAI representent ensemble plus de 60 pour cent du chiffre d’affaires de l’entreprise fin 2025, selon les documents remis a la SEC. Une renegociation, un retard de paiement ou un basculement de charge vers Azure ou une infrastructure maison pourraient fragiliser brutalement le modele economique. L’entree recente de Meta et IBM dans le portefeuille attenue ce risque sans le supprimer.

La deuxieme vulnerabilite est financiere. CoreWeave porte une dette de plus de 12 milliards de dollars fin 2025, utilisee pour financer l’expansion GPU. Les GPU NVIDIA ont une duree de vie economique de trois a cinq ans avant obsolescence competitive. Si le marche IA ralentit ou si les prix horaires chutent sous la pression des hyperscalers, la couverture de cette dette devient problematique. Les agences de notation ont d’ailleurs assorti leurs notes d’un outlook prudent, reflechi a cette asymetrie entre dette longue et cycle court du materiel.

Le troisieme risque, et probablement le plus structurant a moyen terme, est energetique. Un rack GB200 NVL72 consomme 120 kW, soit dix fois plus qu’un rack serveur traditionnel. Le deploiement de plusieurs milliers de racks exige des accords d’approvisionnement electrique de plusieurs centaines de megawatts, dans un contexte ou le reseau americain sature et ou les permis de centres de donnees rencontrent une opposition croissante. CoreWeave a multiplie les partenariats avec Core Scientific, Applied Digital et plusieurs developpeurs d’energie nucleaire modulaire, mais la disponibilite de capacite electrique reste le facteur limitant numero un pour 2026-2028.

Perspectives marche cloud IA 2026-2028 : fragmentation et specialisation

La dynamique engagee par CoreWeave annonce une recomposition profonde du marche cloud IA sur la periode 2026-2028. Le scenario le plus probable est celui d’une fragmentation entre trois categories d’acteurs : les hyperscalers generalistes qui conservent leur avance sur les charges enterprise mixtes, les specialistes IA comme CoreWeave, Lambda Labs ou Crusoe qui captent le segment entrainement et inference a haute performance, et les nouveaux entrants souverains ou sectoriels qui emergent sous l’impulsion des politiques industrielles europeennes et asiatiques.

Plusieurs facteurs vont conditionner cette recomposition. L’arrivee de l’architecture Rubin en 2026-2027 constituera un test grandeur nature : CoreWeave conservera-t-il son avantage de deploiement precoce, ou les hyperscalers reduiront-ils l’ecart grace a leurs investissements croissants dans les equipes NVIDIA ? La montee en puissance des puces maison (Trainium chez AWS, MAIA chez Microsoft, TPU chez Google) posera egalement la question de la pertinence d’un modele monolithiquement NVIDIA comme celui de CoreWeave. Enfin, la consolidation est inevitable : le marche ne peut pas accueillir durablement une dizaine de specialistes GPU, et les operations de fusion ou de rachat par les hyperscalers sont une hypothese serieuse a partir de 2027.

Pour les DSI et les responsables IA des entreprises europeennes, le message est clair : la strategie cloud IA ne peut plus etre mono-fournisseur. CoreWeave offre un complement pertinent aux contrats AWS, Azure ou GCP existants, particulierement pour les projets d’entrainement massif ou la performance par euro investi devient un critere decisif. L’enjeu n’est pas de remplacer les hyperscalers, mais d’integrer les specialistes dans une architecture multi-cloud raisonnee.

Questions frequentes

Qu’est-ce que NVIDIA GB200 NVL72 exactement ?
GB200 NVL72 est une plateforme rack-scale de NVIDIA regroupant 72 GPU Blackwell et 36 CPU Grace dans un meme domaine NVLink, conçue pour l’entrainement, l’inference et les agents IA a grande echelle. Elle peut s’etendre jusqu’a 110 000 GPU via des reseaux Quantum-2 InfiniBand.

CoreWeave est-il vraiment un concurrent serieux d’AWS, Azure et Google Cloud ?
Sur le segment specifique du cloud IA haute performance, oui. CoreWeave deploie plus rapidement les nouvelles architectures NVIDIA et propose un TCO generalement 30 a 50 pour cent inferieur aux hyperscalers pour les charges d’entrainement. En revanche, il ne rivalise pas sur l’ecosysteme de services manages generalistes.

Quels sont les principaux clients de CoreWeave Blackwell ?
Les clients confirmes pour GB200 NVL72 incluent Cohere pour l’IA d’entreprise et les agents North, IBM pour la prochaine generation de Granite, et Mistral AI pour ses modeles ouverts. Microsoft et OpenAI restent les plus gros clients historiques de la plateforme CoreWeave globale.

CoreWeave est-il disponible en Europe ?
Oui, CoreWeave exploite des sites en Europe et developpe sa couverture pour repondre a la demande francaise, allemande et britannique. L’ouverture de nouvelles regions est prevue en 2026-2027, avec une attention particuliere aux exigences de souverainete et de conformite RGPD.

Quel est le risque principal pour CoreWeave a moyen terme ?
La concentration client (Microsoft et OpenAI pesant plus de 60 pour cent du chiffre d’affaires), la dette superieure a 12 milliards de dollars face a l’obsolescence rapide des GPU, et la disponibilite d’energie electrique constituent les trois vulnerabilites structurelles majeures du modele.

le dernier