Big River Steel renforce son IT industriel : de VMware et vSAN à Proxmox VE avec Ceph pour assurer la production 24/7

Le panorama actuel des solutions de sauvegarde pour Proxmox VE

Dans une aciérie moderne, la continuité opérationnelle ne dépend pas uniquement des fours et des bobineuses. Elle repose également sur une couche numérique qui ne peut échouer. Big River Steel, l’un des producteurs d’acier les plus avancés des États-Unis, opère selon une exigence permanente : une production 24/7 et des systèmes capables de répondre avec précision et fiabilité. Dans ce contexte, l’infrastructure de virtualisation et de stockage cesse d’être simplement “IT d’entreprise” pour devenir une infrastructure critique, aussi essentielle que tout équipement de fabrication.

Sur son site d’Osceola (Arkansas), employant plus de 1 200 collaborateurs, l’entreprise s’appuyait depuis plusieurs années sur une pile technologique largement répandue dans le secteur : VMware vSphere Enterprise Plus avec vSAN, puis plus tard Dell VxRail pour gérer le cycle de vie de sa plateforme. Cette approche a soutenu sa croissance initiale, mais, avec le temps, elle a généré de la friction : plus de complexité, des coûts accrus et moins de marges de manœuvre.

Le déclic : coûts en hausse et sentiment de dépendance

Selon le récit du projet, le point d’inflexion est arrivé lorsque l’environnement a commencé à être perçu comme trop conditionné par des décisions de tiers : licences rigides, dépendance à des composants propriétaires et une incertitude croissante après le changement de propriétaire de VMware sous Broadcom. Dans un contexte industriel, cette incertitude a une signification très concrète : risque pour la planification.

Il ne s’agit pas seulement du coût de renouvellement. Il s’agit de savoir si une plateforme critique peut maintenir sa prévisibilité en termes de budget, support, mises à jour et feuille de route. Et, lorsque cette prévisibilité se détériore, le débat s’oriente vers une idée autrefois considérée comme « philosophique » : l’indépendance vis-à-vis du fournisseur.

Le choix : Proxmox VE et une architecture basée sur Ceph

Big River Steel a étudié plusieurs options et a finalement opté pour Proxmox Virtual Environment (Proxmox VE), en s’appuyant sur deux facteurs qui, dans l’industrie, ont plus de poids que n’importe quel slogan :

  • Transparence et contrôle à long terme, grâce à une base open source et un modèle opérationnel plus direct.
  • Intégration avec Ceph, pour reconstruire le stockage avec une architecture distribuée et évolutive.

La migration a été menée avec un périmètre important : quatre clusters de trois nœuds chacun (soit 12 nœuds au total), transférés de VMware à Proxmox VE. L’équipe souligne que le processus s’est déroulé avec une planification minutieuse, une formation adaptée, et que la transition s’est faite en douceur, sans interruption opérationnelle.

Ce qu’il y avait avant et ce qui a changé après

Avant la migration, Big River Steel disposait de :

  • 2 clusters de 3 nœuds basés sur Dell PowerEdge R740XD.
  • 2 clusters de 3 nœuds supplémentaires avec Dell VxRail P670F.
  • Une configuration avec vSAN, combinant SSD, NVMe et disques mécaniques, interconnectés via plusieurs liens 25 GbE.
Ceph, organisé en « pools » (piscines) différenciés — incluant des pools dédiés aux SSD, NVMe et disques classiques — et un CephFS pour la gestion d’éléments tels que ISO, images et modèles.

Le témoignage de l’équipe est clair et officiel : Brian Clark, Ingénieur en automatisation PL de Meltshop, met en avant l’impact concret de cette intégration :

“Nous sommes extrêmement satisfaits de Proxmox Virtual Environment. L’intégration fluide avec Ceph a été un véritable tournant, nous offrant la flexibilité et l’évolutivité dont nous avions besoin, sans les coûts de licence élevés de vSAN.”

Tableau : “avant et après” dans le cas de Big River Steel

Zone Avant (VMware) Après (Proxmox VE)
Virtualisation vSphere Enterprise Plus Proxmox VE
Stockage vSAN (HCI) Ceph (pools SSD/NVMe/standard) + CephFS
Matériel cité R740XD + VxRail P670F Réutilisation du même environnement
Red cité Plusieurs liens 25 GbE Maintien de la haute capacité réseau
Objectif opérationnel Croissance avec dépendance accrue et complexité Plateforme plus prévisible, flexible et résiliente

Moins “d’incidents en urgence” : l’impact au quotidien

En virtualisation industrielle, le succès ne se mesure pas en démo, mais à l’efficacité en opération y compris en pleine nuit. Ce cas illustre un changement concret : plus de stabilité et de performance, ce qui se traduit directement par moins de temps consacré à éteindre des feux, et plus à améliorer et innover dans les processus.

Par ailleurs, Big River Steel a intégré Proxmox DataCenter Manager pour obtenir une vision globale de ses clusters et centraliser la gestion. L’équipe souligne à quel point l’interface pratique, combinée à une intégration opérationnelle, donne tout son sens quand l’infrastructure passe du modèle « cluster » à celui de « domaine » à gérer avec cohérence.

Ce que ce cas suggère pour le débat sur l’indépendance vis-à-vis du fournisseur

Le cas de Big River Steel contribue à concrétiser un débat fréquent en TI : l’indépendance vis-à-vis du fournisseur est-elle un luxe ou une nécessité ? Dans les environnements critique, elle apparaît souvent comme une police d’assurance opérationnelle apportant trois bénéfices majeurs :

  1. Prévisibilité : meilleure capacité à planifier coûts et évolution technologique.
  2. Optionnalité : possibilité réelle de renégocier, ajuster ou changer sans tout reconstruire.
  3. Architecture explicite : visibilité accrue sur les décisions techniques (plus auditables et durables).

Ce choix comporte aussi une contrepartie : l’indépendance ne veut pas dire « tout faire soi-même ». Le projet montre l’importance du soutien du fabricant et de la formation officielle pour adopter de bonnes pratiques et maîtriser l’environnement, renforçant la confiance opérationnelle. En résumé : le contrôle s’obtient à la fois par la technologie et par le développement des compétences internes.

Questions fréquentes

Quel type d’entreprises peuvent envisager de migrer de VMware vers Proxmox VE ?

Les organisations disposant d’une infrastructure virtualisée mature — notamment celles qui recherchent une meilleure prévisibilité des licences, une flexibilité technique et un contrôle accru du cycle de vie — étudient souvent des alternatives. En secteurs 24/7, le facteur déterminant reste la continuité opérationnelle et la capacité à planifier.

Ceph peut-il remplacer vSAN dans des architectures hyperconvergées ?

Ceph peut jouer un rôle de stockage distribué dans des environnements virtualisés, avec des options de design (pools par performance, réplication, systèmes de fichiers comme CephFS) permettant d’adapter l’architecture à différents profils de charge. La compatibilité dépend du design, du réseau, de l’exploitation et de l’expérience de l’équipe.

Qu’est-ce que le “vendor lock-in” et pourquoi est-ce plus préoccupant en milieu industriel ?

Le « verrouillage fournisseur » correspond à une dépendance technique et contractuelle à un seul fournisseur pour des systèmes critiques. En industrie, cette dépendance renforce le risque quand changent les conditions de licences, support ou feuille de route, car le coût de l’erreur ou du retard de réaction est plus élevé.

Quel rôle jouent la formation et le support dans une migration virtuelle critique ?

Ils jouent un rôle central. L’équipe souligne que le support et la formation ont permis d’adopter de bonnes pratiques, d’opérer en confiance, et de minimiser la friction et le risque lors de la transition.

Source : Proxmox Solutions

le dernier