L’industrie de l’intelligence artificielle se prépare à une avancée majeure grâce à une nouvelle technologie de mémoire révolutionnaire. SanDisk a annoncé l’intégration de Raja Koduri, ancien architecte graphique chez Apple, AMD et Intel, au sein de son Conseil Technique pour diriger le développement de la High Bandwidth Flash (HBF™). Cette architecture innovante pourrait permettre la création de cartes graphiques avec jusqu’à 4 To de VRAM, ouvrant la voie à une transformation du traitement de l’IA tant dans les centres de données que sur le terrain.
L’annonce, confirmée par l’entreprise et le principal intéressé sur les réseaux sociaux, s’accompagne de la nomination de David Patterson, professeur emblématique et co-créateur du design RISC, comme président du conseil. La HBF se présente comme une solution complémentaire à la mémoire haute bande passante (HBM), avec pour objectif d’accroître la capacité de stockage à moindre coût tout en conservant un débit élevé. Selon SanDisk, cette nouvelle mémoire pourrait offrir de 8 à 16 fois plus de capacité que la HBM, sans augmenter la consommation d’énergie ni les coûts.
Pour y parvenir, la HBF utilise une mémoire flash NAND 3D BiCS reliée directement à une interface CMOS, avec 16 noyaux empilés via des vias en silicium, permettant un accès simultané à plusieurs sous-ensembles de mémoire en parallèle. Conçue spécifiquement pour les charges d’inférence en temps réel, cette architecture vise à optimiser le traitement de modèles IA déjà entraînés, ce qui pourrait réduire significativement le coût et la complexité des applications d’IA déployées à la périphérie.
Raja Koduri souligne que la performance en IA dépend de la puissance de calcul, de la mémoire et du débit. La HBF intervient principalement pour augmenter la capacité mémoire, ce qui pourrait jouer un rôle déterminant pour le traitement massif de l’inférence dans des domaines tels que les assistants vocaux, la vision par ordinateur et les véhicules autonomes.
Les premières applications de cette technologie devraient se concentrer sur le secteur professionnel, avec l’espoir d’une adoption plus large grâce à ses standards ouverts, facilitant son intégration par les constructeurs de matériel et développeurs d’accélérateurs. En offrant un accès à des capacités de mémoire auparavant réservées aux centres de données, la HBF pourrait permettre une nouvelle ère où l’intelligence artificielle se déploie plus près de l’utilisateur final, dans des voitures, smartphones, usines intelligentes ou dispositifs de réalité augmentée.
Bien que la date de lancement ne soit pas encore fixée, SanDisk s’appuie sur ses ressources techniques et ses partenaires pour accélérer le développement de cette technologie. Pour Raja Koduri, la HBF marque le retour à une vision où l’architecture mémoire devient un levier pour de nouveaux paradigmes de calcul, comme cela a été le cas avec ses expériences chez AMD et Intel.
Selon lui, cette innovation pourrait transformer radicalement la manière dont l’IA fonctionne dans l’environnement edge, en équipant les dispositifs de capacités de mémoire traditionnellement limitées, et en modifiant autant le lieu que la méthode d’exécution des inférences. La High Bandwidth Flash pourrait ainsi ouvrir une nouvelle frontière dans la conception des architectures IA, où coûts, capacité et performance s’harmonisent pour rapprocher la puissance de traitement des utilisateurs finaux.
De la consommation intensive à la résilience énergétique : comment les centres de données deviennent des alliés du système électrique