La chimie quantique apprend avec l’IA à l’échelle exa : Sunway met à l’échelle des réseaux neuronaux pour des molécules « réelles »

La chimie quantique apprend avec l'IA à l’échelle exa : Sunway met à l’échelle des réseaux neuronaux pour des molécules « réelles »

La Chine rebat les cartes du supercalcul en plaçant la barre très haut. Une équipe de chercheurs a démontré, avec le nouveau superordinateur Sunway “OceanLite”, que les réseaux neuronaux de états quantiques (NNQS) peuvent atteindre des tailles moléculaires significatives, avec une efficacité quasi parfaite et sur dizaines de millions de cœurs. Ce progrès ne se limite pas à une prouesse de performance : il ouvre une voie pragmatique pour modéliser matériaux et réactions chimiques en utilisant la puissance du calcul classique le plus avancé disponible aujourd’hui, sans attendre des processeurs quantiques opérationnels.

Précisément, qu’ont-ils réalisé ?

Ce travail porte une approche déjà connue dans la littérature — les NNQS — jusqu’à l’échelle exaflopique. Il consiste à entraîner un réseau pour approcher la fonction d’onde d’un système électronique, permettant ainsi de prédire ses propriétés et son énergie. Cet entraînement requiert deux étapes particulièrement coûteuses : l’échantillonnage de configurations (images du système quantique) et le calcul de la l’énergie locale pour chacune. À mesure que la molécule grossit, ces deux phases se déséquilibrent, rendant le calcul difficile à échelle efficace ; la scalabilité optimale en est le défi majeur.

Sur le superordinateur Sunway, les chercheurs ont déployé un NNQS-Transformer adapté à l’architecture : cœurs légers pour effectuer les calculs en mémoire locale (scratchpad) et cœurs de gestion coordonnant la communication, avec un équilibrage de charge conçu pour que tous les cœurs travaillent en permanence. Le résultat : le code s’est exécuté sur environ 37 millions de cœurs avec 92 % de scalability en forte charge et 98 % en charge faible, soit une quasi-absence de pertes lors de l’augmentation des ressources pour un problème donné ou lors de l’accroissement du problème avec ces ressources. Une efficacité rarement atteinte dans le cadre de la chimie quantique à cette envergure.

Pourquoi cet exploit est-il important ?

Jusqu’à présent, les NNQS étaient généralement limités à petits systèmes. Cette démonstration atteint structure de jusqu’à 120 orbitales de spin, une étape qui rapproche la méthode de molécules et matériaux à intérêt pratique. Si ces algorithmes peuvent conserver cette performance à grande échelle, les supercalculateurs exascale pourraient accélérer la découverte de nouveaux composés, catalyseurs ou médicaments bien avant la disponibilité de processeurs quantiques mûrs.

De plus, cette expérience renforce une idée fondamentale : les architectures utilisées pour entraîner les grands modèles de langage (LLM) peuvent également apprendre la structure de la matière. Qu’un système conçu pour des charges régulières (apprentissage profond) ait réussi à traiter une charge irrégulière (chimie quantique) avec cette efficience témoigne d’une maturité logicielle, d’un partage de données avancé et d’un travail minutieux sur la communication et les entrées/sorties.

L’intérieur de Sunway : une architecture innovante

Sunway “OceanLite” succède à TaihuLight et utilise des puces SW26010-Pro, organisées en clusters de cœurs avec une mémoire locale “scratchpad” plutôt qu’une architecture de caches hiérarchisée classique. Des dizaines de milliers de ces puces sont interconnectées dans un système de plus de 40 millions de cœurs, démontrant un rendement à l’échelle exaflops pour divers défis scientifiques. La proximité des données et une gestion fine de la mémoire se conjuguent parfaitement avec le design NNQS-Transformer, adapté à cette topologie.

Une caractéristique notable est l’utilisation de Julia dans la chaîne logicielle : un langage de haut niveau, combiné avec un code optimisé fortement, permettant de prototyper rapidement tout en conservant un performance proche de C/Fortran. Ce qui il y a quelques années était un expérimentiel devient aujourd’hui une composante intégrée dans un environnement HPC performant.

Les limites actuelles

La première barrière était la scalabilité mathématique. La suivante sera de déménager et gérer les données. Ces simulations génèrent des volumes massifs et nécessitent une communication constante de millions de cœurs. La contrainte se déplace vers le stockage et les réseaux, qui devront offrir des transferts de données quasi aussi rapides que le calcul. Sans une infrastructure I/O à la hauteur, l’efficacité théorique restera lettre morte.

Par ailleurs, il est crucial d’étendre le catalogue de systèmes : au-delà de 120 orbitales de spin, vers des géométries complexes, des états excités ou des environnements (solvants, surfaces). L’objectif est non seulement l’échelle, mais aussi la précision chimique comparée aux méthodes de référence (par exemple, couplage multi-cadres), notamment en régimes à forte corrélation.

Impacts pour la synergie IA-science

Ce message est double. Pour la chimie et matériaux, l’IA ne remplace pas la physique quantique, mais la approche avec une relation précision/coût de plus en plus attractive s’appuie sur ces superordinateurs. Pour le HPC, cette avancée montre que l’exascale ne se limite pas à la performance pure, mais ouvre de la nouvelle science lorsque l’algorithme, l’architecture et le software sont alignés.

Dans une perspective à moyen terme, on peut anticiper des collaborations croisées : des groupes en chimie apportant des métriques de validation, des équipes HPC optimisant communication, programmation hétérogène et stockage, et des fournisseurs de mémoire et réseaux proposant des topologies mieux adaptées aux NNQS. Si cette synergie se concrétise, il serait possible de voir les matériaux et médicaments bénéficier de progrès inattendus, et ce, plus tôt que prévu.

Contexte et perspectives

L’usage des réseaux neuronaux pour modéliser les fonctions d’onde n’est pas nouveau, mais son passage à l’échelle constitue une avancée majeure. La communauté scientifique avait déjà expérimenté des variantes Transformers sur des problèmes moyens — avec de bonnes métriques et une bonne scalabilité ; le projet Sunway a aussi réalisé des simulations quantiques massives (comme des circuits aléatoires) avec une efficacité presque idéale. La nouveauté réside dans l’association de ces deux approches — NNQS et supercalculateurs Sunway — pour démontrer la cohérence et la stabilité là où auparavant prédominaient l’irrégularité et la gestion des goulots d’étranglement.

Les prochaines étapes

  • Augmenter la chimie réelle : validations avec des ensembles étendus et comparaisons directes avec des méthodes ab initio.
  • Nouvelles technologies I/O : réseaux plus intelligents et stockage accéléré pour que le calcul ne soit pas freiné par l’acheminement des données.
  • Reproductibilité : transférer ces résultats vers d’autres architectures exascale (États-Unis, UE, Japon) pour faire de cette approche un outil de référence.

Source : vastdata et IEEE Explore

le dernier