Backblaze donne des chiffres sur la fiabilité des disques durs en 2025 : moins de pannes, plus de capacité et quelques « drapeaux rouges »

Backblaze donne des chiffres sur la fiabilité des disques durs en 2025 : moins de pannes, plus de capacité et quelques « drapeaux rouges »

Dans une époque où l’actualité technologique tourne souvent autour de l’Intelligence Artificielle et des microprocesseurs, Backblaze revient avec quelque chose de moins spectaculaire, mais profondément utile pour toute équipe d’exploitation : la publication de données. Son rapport annuel Drive Stats 2025 marque ses 13 ans de suivi continu des performances des disques durs en opération. Au fil du temps, cette série est devenue un baromètre rare et précieux pour comprendre ce qui se passe réellement lorsque des centaines de milliers de disques tournent jour et nuit dans des centres de données.

Le grand titre de cette année est clair : le taux de panne annuel (AFR) pour 2025 recule à 1,36 %, contre 1,55 % en 2024. Sur le dernier trimestre (Q4 2025), la donnée s’améliore encore, atteignant 1,13 %, tandis que la vision “sur toute la durée de vie” reste quasi stable à 1,30 %. En langage courant : le parc de disques semble plus sain, mais cela ne signifie pas que la maintenance disparaît ; elle change simplement de forme.

Une observation impressionnante : des centaines de milliers de disques sous surveillance

Backblaze indique qu’à la fin de 2025, il surveillait 349 462 unités de stockage pour ses systèmes. Pour l’analyse annuelle, ils excluent les disques de démarrage et autres qui ne remplissent pas leurs critères statistiques, laissant ainsi 344 196 disques valides répartis en 30 modèles. Le rapport ne se limite pas à “compter les pannes” : il contextualise aussi par âge, nombre de “jours de fonctionnement” et modifications opérationnelles, évitant ainsi des conclusions trompeuses lorsque la taille de l’échantillon est faible ou si le matériel approche de la fin de sa vie utile.

Ce mode opératoire est essentiel pour interpréter correctement les chiffres : dans la réalité, le “comment” est aussi important que le “combien”. Un pic de pannes peut indiquer un défaut de firmware, mais aussi une vibration persistante, un châssis ayant un comportement anormal, un lot spécifique, ou simplement l’usure naturelle après plusieurs années de service.

Que signifie l’AFR et pourquoi Backblaze limite-t-il son propre jeu de données ?

L’AFR (Taux de Panne Annuel) est une mesure permettant d’annualiser les pannes pour mieux comparer dans le temps, même si l’analyse porte sur un trimestre. De plus, Backblaze fixe des seuils minimums pour inclure certains modèles dans ses tableaux et graphiques : par exemple, pour une analyse trimestrielle, il faut plus de 100 unités et un total de 10 000 “jouées de disques”. En annuel, ce seuil est de > 250 unités et > 50 000 “jours de disque”. Sur toute la vie, il faut plus de 500 unités et > 100 000 “jours de disque”. L’objectif est simple : éviter qu’un petit nombre de défaillances dans un groupe réduit ne déforme l’image globale.

Pour ceux qui achètent ou exploitent des solutions de stockage, la leçon est claire : les comparaisons de fiabilité ne sont pertinentes que si la taille de l’échantillon et la période en service sont suffisantes. Et, même alors, il faut privilégier la tendance plutôt qu’un chiffre ponctuel.

Une capacité accrue avec moins de disques : une flotte qui évolue vers des tailles importantes

Une des images clés du rapport concerne la répartition des capacités. Backblaze constate que le poids du stockage se déplace vers des disques de grande capacité : dans leur répartition, les disques de 0 à 12 TB représentent 25,13 %, ceux de 14 à 16 TB montent à 52,06 %, et ceux de 20 TB ou plus atteignent 22,81 %. Cela confirme une tendance observée dans de nombreux centres de données : réduire le nombre d’unités pour stocker la même quantité d’informations (réduisant ainsi les points de défaillance potentiels et le travail de remplacement), tout en nécessitant une planification plus précise pour la capacité, les reconfigurations et la résilience.

Dans ce contexte, le rapport souligne aussi l’arrivée de nouvelles unités dans la flotte, notamment un modèle de 26 TB de Western Digital (premier disque de 26 TB en production), signe que la course à la densité de stockage s’accélère.

Le “tableau d’honneur” et les alertes : quand le problème ne vient pas du disque, mais de l’environnement

Backblaze accompagne ses statistiques d’une liste très concrète : des modèles performants et d’autres qui envoient des alertes. Au Q4 2025, trois cas se distinguent par leur AFR trimestrale élevée :

  • HGST HUH728080ALE600 (8 TB) : 10,29 %
  • Seagate ST10000NM0086 (10 TB) : 5,23 %
  • Toshiba MG08ACA16TEY (16 TB) : 4,14 %

Le cas du HGST 8 TB est particulièrement intéressant : plutôt que de le qualifier de “modèle défectueux”, la société précise que le groupe analysé comportait 1 073 disques, moins que ce qu’équivaut un “Vault” standard de 1 200 appareils, suggérant une concentration physique. Leur enquête interne a exclu une cause principale liée à la température, et la suspecte plutôt à une sensibilité accrue aux vibrations. L’âge joue aussi un rôle, avec une moyenne d’environ 7,5 ans. La décision opérationnelle a été de retirer ces unités du service dans le cadre d’un processus de migration normal.

Le cas du Toshiba MG08ACA16TEY est également révélateur : il montre l’impact des mises à jour du firmware et des mesures correctives. Après un trimestre précédent à AFR exceptionnellement élevé, Backblaze mentionne un travail collaboratif sur le firmware et une “normalisation” progressive. La valeur reste au-dessus de l’idéal, mais la tendance indique que le problème ne réside pas uniquement dans le matériel, mais aussi dans la façon dont sa maturité est gérée en production.

La réalité opérationnelle : remplacer des disques demeure une tâche quotidienne

Malgré l’amélioration de l’AFR, la logistique ne s’arrête pas : au Q4 2025, 943 disques défaillaient, ce qui équivaut, dans un contexte opérationnel, à des dizaines de remplacements quotidiens dans une grande flotte. C’est le côté moins glamour du stockage massif : la maintenance n’est pas un “événement”, mais une routine industrielle.

Tu l’auras compris, Drive Stats est particulièrement intéressant pour les équipes en charge des systèmes, principalement pour affiner les politiques de gestion du cycle de vie, les stocks de pièces de rechange, les migrations préventives, le contrôle des vibrations, et le type d’observabilité (SMART, alertes, tickets) permettant d’éviter qu’un problème local ne devienne une statistique globale.


Questions fréquentes

Qu’est-ce que la taux de panne annuel (AFR) et comment l’interpréter dans les centres de données ?
L’AFR estime le pourcentage de disques susceptibles de tomber en panne sur une année si le même rythme de défaillance se maintenait. Elle est utile pour comparer différents trimestres ou années, mais doit être considérée conjointement avec “drive days”, la taille de l’échantillon et l’âge des disques.

Que signifie la baisse de l’AFR à 1,36 % en 2025 chez Backblaze ?
Cela indique une amélioration globale de la fiabilité de leur flotte par rapport à 2024. Cela ne veut pas dire que les disques tombent peu en panne, mais que la proportion de remplacements diminue, même si, en valeur absolue, les opérations de remplacement restent nombreuses.

Quels modèles ont donné des signes d’alerte au Q4 2025 selon Backblaze Drive Stats ?
Les plus marquants par leur AFR trimestrale élevée sont HGST HUH728080ALE600 (8 TB), Seagate ST10000NM0086 (10 TB) et Toshiba MG08ACA16TEY (16 TB). Backblaze fournit aussi un contexte opérationnel : âge, environnement, firmware, avant de tirer des conclusions.

Ces données peuvent-elles guider le choix de disques pour NAS ou serveurs en entreprise ?
Oui, comme référence, mais avec prudence : les résultats dépendent du contexte spécifique, de l’usage, de la maturité du matériel, et de la taille de l’échantillon. La tendance et la gestion du cycle de vie ont généralement plus de valeur que la recherche du “meilleur modèle” absolu.

source : backblaze

le dernier