Rackspace et AMD misent sur un cloud IA gouverné pour les secteurs réglementés

Rackspace Technology lance un service de GPU à la demande propulsé par NVIDIA pour accélérer l'intelligence artificielle et l'apprentissage automatique

Rackspace Technology et AMD ont signé un protocole d’accord pour bâtir une infrastructure d’IA d’entreprise taillée pour les secteurs réglementés. Pas un cloud générique : une plateforme dédiée, gérée et gouvernée, tournant sur des GPU AMD Instinct et des processeurs AMD EPYC, avec Rackspace en charge de l’ensemble du stack, du matériel à l’inférence en production. La finance, la santé, la fonction publique et les télécoms sont dans le viseur.

Précision utile d’emblée : il s’agit d’un MOU, un cadre de collaboration potentielle, pas d’un accord commercial définitif. Rackspace le dit clairement dans son communiqué — aucun contrat n’a été signé, les bénéfices annoncés ne sont pas garantis. Autant le poser avant d’analyser la portée réelle de cette initiative.

Un MOU, pas encore un produit

Ces deux dernières années, le marché a tourné autour de la location de GPU à l’heure. Simple, scalable, mais insuffisant pour une organisation qui doit contrôler où vont ses données, comment ses processus sont audités et qui répond quand une charge tombe. Rackspace et AMD adressent ce manque avec une promesse opérationnelle : un responsable unique de la plateforme, avec des SLA, un support matériel et une gouvernance intégrée dès la conception.

Le contexte est clair. Un nombre croissant d’entreprises est passé de l’expérimentation LLM à la recherche de moyens de déployer l’IA en production en gardant le contrôle des coûts, de la conformité et de la disponibilité. La location d’accélérateurs règle la première étape, pas la seconde.

Quatre composantes sur AMD Instinct et EPYC

Le partenariat s’organise autour de quatre offres. L’Enterprise AI Cloud est un cloud privé et hybride géré sur AMD Instinct et AMD EPYC, destiné aux organisations ayant besoin de souveraineté, de conformité et de contrôle opérationnel. L’Enterprise Inference Engine est un runtime d’inférence contextualisé pour l’entreprise, qui conserve l’historique de session et les connaissances métier entre les requêtes pour que modèles et agents fonctionnent de façon cohérente en production.

L’Inference as a Service propose des GPU AMD Instinct dédiés et gérés, avec outils d’inférence et d’ajustement fin. C’est une alternative gouvernée à la simple location d’accélérateurs, Rackspace prenant en charge la complexité. Le Bare Metal AMD Instinct, enfin, s’adresse aux clients qui exigent isolement physique et performances déterministes pour des charges d’entraînement ou d’inférence très spécifiques.

Ce qui distingue cette offre d’un cloud standard, ce n’est pas uniquement le matériel. La différence porte sur la promesse opérationnelle et sur qui assume la responsabilité quand quelque chose ne fonctionne pas. Pour des secteurs comme la banque, la santé ou la fabrication avancée, un opérateur unique avec des engagements contractuels peut être plus attractif que de déporter des données sensibles vers des services IA génériques sans architecture claire de responsabilités.

La position d’AMD face à la domination NVIDIA

Pour AMD, ce partenariat renforce sa stratégie dans l’IA d’entreprise. NVIDIA conserve une position dominante dans l’accélération, les logiciels, les frameworks et l’adoption par les hyperscalers. CUDA reste le standard de facto pour les développeurs et les laboratoires de recherche. AMD pousse Instinct, EPYC et ROCm, sa pile logicielle ouverte pour l’accélération GPU, comme alternative viable.

Les GPU AMD Instinct MI300X, avec leur grande mémoire HBM et leur haut débit, ciblent déjà les charges d’IA générative et HPC. Plus récemment, AMD a lancé la série MI350, dont la MI350P PCIe, conçue pour déployer de l’IA générative et des agents dans des infrastructures existantes sans refonte complète des centres de données. Une approche qui convient aux entreprises voulant éviter de dépendre de grands clusters fermés ou d’attendre des cycles longs de renouvellement matériel. On retrouve cette dynamique dans la course AMD-Samsung sur les puces de 2 nanomètres, qui illustre l’ambition plus large d’AMD de réduire l’écart avec NVIDIA sur toute la chaîne.

Les processeurs EPYC jouent un rôle fondamental. La discussion tourne souvent autour du GPU, mais les performances réelles d’un système IA dépendent du CPU, de la mémoire, du réseau, du stockage, de la virtualisation et de l’orchestration. Rackspace et AMD veulent vendre ce système complet comme une plateforme opérationnelle, pas une liste de composants à assembler soi-même.

Pour que l’Enterprise AI Cloud basé sur AMD soit vraiment attractif, Rackspace devra faire une grande partie du travail difficile : intégration, validation de modèles, compatibilité des outils, optimisation de l’inférence et support continu. ROCm a progressé ces deux dernières années, mais la maturité de l’écosystème reste un écart réel à combler face à NVIDIA.

Gouvernance, souveraineté et agents en production

Le terme « gouverné » est central dans cette annonce. Les entreprises ne demandent plus seulement si un modèle répond bien. Elles demandent si le système peut s’intégrer dans leurs politiques de sécurité, d’audit, de traçabilité et de conformité. Cette exigence devient encore plus critique avec les agents IA, qui ne se contentent pas d’interroger un modèle mais exécutent des étapes, consultent des données internes et automatisent des tâches métier.

L’Enterprise Inference Engine de Rackspace promet de conserver le contexte métier et l’historique de session entre les requêtes. Utile pour les agents en production, mais cela implique des exigences de sécurité sérieuses : séparation des clients, chiffrement, audit des accès, politiques de rétention et supervision humaine pour les processus critiques.

En Europe, la souveraineté IA est un sujet concret. Des organisations réévaluent où opèrent leurs systèmes, quelle législation s’applique et comment protéger leurs données des accès non autorisés. Rackspace, fournisseur américain, ne résout pas tous ces enjeux à lui seul. Mais l’idée d’un cloud privé et gouverné répond à une demande réelle : l’IA d’entreprise ne peut pas toujours s’appuyer sur des services publics génériques quand les données ou les processus sont sensibles. Cette logique s’inscrit dans la tendance plus large qu’analyse notre article sur l’IA qui redessine la carte des centres de données, du continent américain aux régions rurales européennes.

Beaucoup de clients ne veulent pas devenir opérateurs d’infrastructures IA. Ils veulent utiliser leurs modèles et agents sans gérer la complexité en dessous. C’est l’espace que Rackspace tente d’occuper : non plus simple hébergeur ou cloud managé, mais opérateur d’IA d’entreprise de bout en bout. Les acteurs réglementés n’achètent pas des promesses. Ils exigent des références, des certifications, des performances mesurables, des coûts prévisibles et la capacité à s’intégrer dans leurs systèmes existants. Si le MOU se transforme en offres concrètes avec des déploiements tangibles et des SLA crédibles, Rackspace occupera une position intéressante entre le cloud public des hyperscalers et l’infrastructure privée autogérée.

Questions fréquentes

Qu’est-ce que le MOU signé entre Rackspace et AMD ?

Un protocole d’accord de collaboration potentielle, pas encore un contrat commercial définitif. Rackspace précise qu’aucun accord final n’a été conclu et que les bénéfices annoncés ne sont pas garantis.

Quels secteurs visent Rackspace et AMD avec ce partenariat ?

Finance, santé, fonction publique, télécoms et industrie avancée : des secteurs où souveraineté des données, conformité réglementaire et contrôle opérationnel sont des exigences non négociables.

Quels GPU AMD sont utilisés dans cette offre ?

Les AMD Instinct MI300X pour les charges IA générative et HPC, et la série MI350 (dont la MI350P PCIe) pour déployer des agents et modèles dans des infrastructures existantes sans refonte complète.

En quoi cette offre se distingue-t-elle de la simple location de GPU ?

Rackspace assume la responsabilité opérationnelle de toute la plateforme : intégration, sécurité, gouvernance, SLA, support matériel et contrôle des coûts. Le client n’a pas à gérer la complexité technique sous-jacente.

Quel est le principal défi pour AMD dans ce partenariat ?

La maturité de l’écosystème. CUDA de NVIDIA est le standard de facto pour les développeurs et les frameworks. Pour que ROCm et les GPU AMD Instinct soient vraiment attractifs en entreprise, Rackspace devra assurer l’intégration, la validation de modèles et la compatibilité des outils au quotidien.

le dernier