Une récente étude menée par l’Université technique de Munich en collaboration avec l’Université de Copenhague remet en question une idée longtemps acceptée dans l’industrie du stockage : tous les SSD semblables en capacité et technologie se comporteraient de la même manière en pratique. En utilisant un nouveau benchmark appelé SSD-iq, les chercheurs ont découvert que deux disques SSD presque identiques sur le papier pouvaient présenter des performances radicalement différentes dans des charges de travail réelles.
L’étude, publiée dans Proceedings of the VLDB Endowment sous le titre « SSD-iq : Découvrir le côté caché de la performance SSD », dévoile des métriques essentielles souvent ignorées par les tests classiques. Parmi celles-ci, la véritable amplification d’écriture (WAF) et la latence sous charge, qui jouent un rôle déterminant dans l’efficacité et la durabilité des disques en environnement professionnel.
Les expérimentations sur divers modèles provenant de fabricants prestigieux tels que Samsung, SK Hynix, Intel, Micron, Western Digital, Kioxia, ainsi que des unités en cloud, ont révélé des écarts pouvant atteindre 2,5 fois pour le WAF, ainsi que des latences pouvant passer de microsecondes à plusieurs millisecondes, malgré des fiches techniques similaires.
L’un des principaux enjeux concerne le WAF : alors qu’un disque dur traditionnel peut écrire à un même endroit, un SSD doit effacer des blocs entiers et repositionner les pages, ce qui entraîne des écritures internes supplémentaires invisibles pour l’utilisateur. Le WAF mesuré oscille parfois entre 1,9 et plus de 6, selon le modèle, ce qui signifie qu’un SSD peut effectuer jusqu’à six fois plus d’écritures internes que ce que le système d’exploitation perçoit, impactant ainsi sa durée de vie et ses coûts de maintenance.
Paradoxalement, les charges avec accès biaisé, typiques dans les bases de données, n’amélioraient pas ces métriques, voire les aggravaient, révélant la faiblesse des algorithmes de gestion de la collecte de déchets (GC) utilisés dans certains modèles. De plus, la latence observée sous charge durable pouvait dépasser 10 ms, contre une attente nominale de moins de 100 μs, rendant certains SSD inadéquats pour des applications exigeantes telles que les transactions OLTP.
Pour pallier ces limitations, les chercheurs ont développé SSD-iq, une plateforme de tests open source disponible sur GitHub, qui fournit des mesures réalistes des performances réelles : WAF effectif, latence en haut percentiles, performance avec des accès biaisés, et espace réservé par le fabricant pour la gestion de la GC. Ces critères offrent une évaluation plus fidèle de l’impact en environnement professionnel.
Une étude comparative entre le Samsung PM9A3 et le Micron 7450 PRO met en évidence qu’un choix de SSD ne peut plus se baser uniquement sur les données techniques. Si le Samsung assure une meilleure stabilité en charge, le Micron présente une résistance accrue à l’usure. Le choix dépend donc de si l’on privilégie la performance immédiate ou la durabilité.
Les implications de ces découvertes dépassent la simple performance : elles concernent la durabilité environnementale des centres de données. Réduire le WAF grâce à des algorithmes plus avancés prolonge la vie des disques, réduit les déchets électroniques, et diminue l’empreinte énergétique. L’avènement des technologies telles que ZNS (Zoned Namespace) et FDP (Flexible Data Placement) pourrait également ouvrir la voie à une collaboration accrue entre hôte et stockage pour gérer ces problématiques.
En conclusion, cette étude démontre que les SSD ne sont pas interchangeables à l’instar de ce qu’annoncent souvent leurs fiches techniques. Les benchmarks traditionnels masquent de nombreux phénomènes clés, et seul SSD-iq permet d’évaluer réellement la performance dans des contextes critiques. Si l’industrie adopte cette nouvelle approche, cela pourrait marquer une révolution dans la manière dont nous sélectionnons et utilisons le stockage pour l’ère de l’intelligence artificielle et des transactions en temps réel.