La virtualisation des GPU devient une réalité avec Proxmox VE
La virtualisation des GPU fait aujourd’hui partie intégrante des environnements de production, et Proxmox VE, l’une des plateformes de virtualisation les plus prisées, a franchi une étape décisive en intégrant officiellement la technologie NVIDIA vGPU depuis la version 18 de son logiciel. Cette intégration permet à plusieurs machines virtuelles de partager une unique GPU physique, ouvrant ainsi la voie à des environnements d’entreprise plus efficaces et puissants.
Un engagement en faveur de la flexibilité et de la performance
L’installation de NVIDIA vGPU sur Proxmox VE a été testée dans des environnements professionnels avec des GPU tels que la RTX A5000, tout en étant compatible avec un large éventail de cartes, selon la liste officielle de NVIDIA. Les entreprises désireuses de tirer parti de cette technologie doivent disposer d’un abonnement actif Proxmox VE (niveau Basique, Standard ou Premium) ainsi que d’une licence valide pour NVIDIA vGPU.
Pour les environnements de production, Proxmox recommande l’utilisation de matériel de niveau entreprise et la vérification préalable de la compatibilité du système avec des fonctionnalités telles que le PCIe passthrough, VT-d ou AMD-v, SR-IOV et le décodage au-dessus de 4G depuis le BIOS ou l’UEFI du serveur.
Préparation et exigences techniques
La version minimale de Proxmox VE requise pour installer le support vGPU est la version 8.3.4, en combinaison avec des noyaux mis à jour (comme 6.8.12-8-pve) et des pilotes NVIDIA de version 570.124.03 ou ultérieure. L’outil pve-nvidia-vgpu-helper, inclus à partir de cette version, facilite des tâches clés telles que la préparation de l’environnement, l’installation des paquets DKMS et le blocage des pilotes incompatibles.
Le processus nécessite de télécharger les pilotes spécifiques depuis le site de NVIDIA (en sélectionnant Linux KVM comme hyperviseur), de les transférer au nœud Proxmox et de procéder à l’installation avec des paramètres DKMS pour garantir la recompilation après des mises à jour de noyau.
Configuration avancée : SR-IOV et mappage des ressources
Sur les GPU les plus récents, basés sur l’architecture Ampere, il est nécessaire d’activer le SR-IOV, qui peut être configuré automatiquement par le service systemd inclus dans Proxmox. Cela permet de créer plusieurs fonctions virtuelles pouvant être assignées à différentes machines virtuelles.
Une fois le SR-IOV activé, il est possible de réaliser un mappage des ressources PCI depuis le centre de données de Proxmox VE, offrant ainsi une gestion simplifiée des cartes et de leurs fonctions virtuelles.
Configuration des machines virtuelles
La prochaine étape consiste à configurer les machines virtuelles qui vont tirer parti des vGPU. Il est nécessaire d’installer un logiciel de bureau à distance sur la machine invitée, car la console intégrée de Proxmox (nonVNC) ne prend pas en charge l’affichage de la GPU virtualisée.
Pour Windows 10/11, la solution la plus courante consiste à activer le Bureau à Distance. Sur les systèmes Linux (comme Ubuntu ou Rocky Linux), l’installation de serveurs VNC tels que x11vnc est recommandée, ainsi que la configuration d’un gestionnaire d’affichage compatible, tel que LightDM.
Une fois l’accès à distance configuré, il faut installer les pilotes NVIDIA dans la machine virtuelle, téléchargés depuis le site officiel et adaptés au système d’exploitation et à la version du pilote hôte.
Licences et utilisation professionnelle
L’utilisation de NVIDIA vGPU en production nécessite le respect des politiques de licence de NVIDIA. La gestion des licences s’effectue via le service Delegated License Service (DLS). Il est essentiel de maintenir l’heure synchronisée sur les machines invitées via NTP afin d’éviter les erreurs de validation des licences.
Un pas en avant pour les environnements graphiques virtualisés
L’association de Proxmox VE et de NVIDIA vGPU représente une solution robuste pour les environnements nécessitant une puissance graphique virtualisée, allant des simulateurs 3D aux domaines de l’ingénierie, du design ou de l’intelligence artificielle. Bien que la configuration technique soit exigeante, le résultat est un environnement puissant et évolutif qui offre aux entreprises des solutions jusqu’alors réservées à des infrastructures beaucoup plus complexes et coûteuses.
(Source : Proxmox GPUs)