Dans un marché cloud dominé par les géants de l’hyperéchelle, Backblaze a décidé de jouer une carte peu conventionnelle : dévoiler ses entrailles. La société a publié son premier rapport Performance Stats T3 2025, une série de tests synthétiques de performance où elle compare son service de stockage Backblaze B2 avec AWS S3, Cloudflare R2 et Wasabi Object Storage.
Par ailleurs, elle a mis à jour son classique rapport Drive Stats, qui détaille les taux de défaillance réels des disques durs à l’alimentation de sa plateforme. Performance et fiabilité, tout en transparence, à une époque où de nombreuses entreprises cherchent un équilibre entre coût, performance et risque dans le cloud.
Tests de performance cloud : un “champ de jeu équitable”
Les tests Performance Stats ont été réalisés avec Warp, un outil open source pour mesurer la performance du stockage compatible S3.
Le scénario de test est unique et contrôlé :
- Machine virtuelle Ubuntu hébergée chez Vultr, dans la région New York / New Jersey.
- Trafic dirigé vers les régions US-East de chaque fournisseur.
- Conditions réseau et configuration identiques pour tous.
- Tests de téléchargement et d’envoi avec des fichiers de 256 KiB, 5 MiB, 50 MiB et 100 MiB.
- Profils de cinq minutes, en mode multi-thread comme single-thread, avec répétition des tests pour obtenir des moyennes stables.
L’objectif déclaré est de fournir une photographie reproductible du comportement de chaque service du point de vue d’un client réel, loin des benchmarks internes souvent peu transparents que certains acteurs publient.
Téléversements : Backblaze excelle sur les petits fichiers, AWS sur les tailles moyennes
La première série de tests mesure le temps moyen de téléversement d’un fichier individuel, en millisecondes. Plus c’est faible, mieux c’est. À noter que Wasabi n’a pas été testé durant les 30 premiers jours d’utilisation de la plateforme en raison de restrictions propres à leur offre.
Temps moyens de téléversement (ms)
| Fournisseur | 256 KiB | 2 MiB | 5 MiB |
|---|---|---|---|
| Backblaze B2 | 12,11 | 116,38 | 268,28 |
| AWS S3 | 28,73 | 76,79 | 201,40 |
| Cloudflare R2 | 16,02 | 123,25 | 311,48 |
| Wasabi | – | – | – |
Le constat est clair :
- Backblaze B2 est le plus rapide pour les petits fichiers (256 KiB), avec une moyenne de seulement 12,11 ms.
- AWS S3 devance pour les fichiers de 2 MiB et 5 MiB, atteignant 76,79 ms et 201,40 ms respectivement.
- Cloudflare R2 reste systématiquement derrière sur cette métrique précise.
Ces données sont utiles dans les scénarios où la latence individuelle est critique — par exemple pour des chargements interactifs via des applications web — mais elles ne racontent pas toute l’histoire lorsqu’il s’agit de transférer de gros volumes de données.
Débit de téléversement multi-thread : Backblaze et Wasabi, très performants en charge continue
Ce qui rend le rapport particulièrement intéressant, c’est dans la partie tests de débit soutenu : combien de MiB par seconde chaque service peut-il télécharger en continu pendant cinq minutes, en utilisant des uploads parallèles.
Plus la valeur est haute, meilleur est le résultat.
Débit de téléversement multi-thread (MiB/s)
| Fournisseur | 256 KiB | 5 MiB | 50 MiB | 100 MiB |
|---|---|---|---|---|
| Backblaze B2 | 163,80 | 573,30 | 1.738,90 | 2.554,50 |
| AWS S3 | 96,20 | 653,40 | 1.747,50 | 2.391,20 |
| Cloudflare R2 | 24,10 | 314,50 | 1.036,50 | 1.356,00 |
| Wasabi | 162,80 | 669,20 | 1.847,20 | 1.977,50 |
Voici quelques points clés :
- Pour les très petits fichiers (256 KiB), Backblaze et Wasabi sont quasiment à égalité en tête, largement au-dessus d’AWS et surtout de Cloudflare.
- Sur les tailles moyennes (5 MiB et 50 MiB), Wasabi se distingue en débit, AWS et Backblaze étant très proches.
- Sur le sommet de 100 MiB, Backblaze B2 établit la différence avec 2.554,50 MiB/s, devant AWS et Wasabi.
- Cloudflare R2 reste systématiquement dans la partie basse du classement, notamment pénalisé pour les objets petits.
Pour des charges de travail réelles — comme l’ingestion de journaux, la sauvegarde de bases de données ou le téléchargement de datasets pour IA — ces chiffres reflètent mieux la performance globale que le temps de téléversement d’un seul fichier, car ils illustrent la capacité de profiter de la parallélisation.
Téléchargements : AWS domine en termes de latence, Backblaze en performances soutenues
Dans le domaine du téléchargement de fichiers, les résultats sont variables :
- En moyenne, AWS S3 est en tête pour toutes les tailles, suivi par Backblaze B2 puis Cloudflare R2.
- En débit soutenu multi-thread, Backblaze B2 remporte les tests pour les fichiers de 256 KiB, 50 MiB et 100 MiB, AWS étant légèrement devant pour le format 5 MiB.
- Lors des tests en single-thread, c’est Wasabi qui offre le meilleur résultat pour le fichier de 256 KiB, tandis que Backblaze se démarque en 5, 50 et 100 MiB.
Le rapport consacre une attention particulière au TTFB (Time To First Byte), une métrique utile pour comprendre la latence initiale. Cependant, il rappelle que ce seul indicateur ne suffit pas à décrire l’expérience : la route réseau, la réutilisation des connexions ou la mise en cache peuvent influencer cette valeur si elle est analysée isolément.
Méthodologie transparente et limites reconnues
Backblaze insiste sur le fait que ses tests sont syntétiques et reproductibles, mais qu’ils ne reproduisent pas exactement tous les scénarios en production. Parmi les limites évoquées :
- Trafic généré depuis une seule région (NY/NJ vers US-East).
- Effets potentiels du cache lors de lectures répétées, malgré les efforts pour minimiser cela.
- Politiques de rate limiting ou de blacklisting de certains fournisseurs face à des patterns de trafic très intensifs, comme ce fut le cas ponctuellement avec Wasabi.
- Absence de tests sur d’autres continents et sans inclure pour le moment des géants comme Google Cloud ou Azure.
Le principal apport du rapport n’est pas tant de fournir un classement définitif, mais plutôt d’ouvrir la méthodologie et les données, invitant des tiers à les reproduire ou les critiquer.
Cas d’usage : selon ses propres chiffres, où se positionne Backblaze ?
À partir des benchmarks, Backblaze identifie plusieurs scénarios où sa combinaison de latence acceptable et de bon débit lui confère des atouts :
- Inférence IA et ML : accès rapide à des modèles et artefacts pour réduire la latence de réponse.
- Feature stores et recherches d’embeddings : bases de données vectorielles pour systèmes de recommandation et RAG, gérant de nombreux petits objets écrits une seule fois et lus à plusieurs reprises.
- Systèmes RAG (retrieval-augmented generation) : stockage et récupération rapide de fragments documentaires pour alimenter des modèles de langage.
- Analytique de logs et événements (SIEM, IoT) : qui combinent écritures continues et lectures intensives.
- Lacs de données interactifs ou sources pour CDN, où la constance du débit et l’absence de coûts de sortie peuvent être déterminants.
La société souligne que la performance « idéale » dépend autant du fournisseur que du design de l’application : connaître un service performant avec de petits ou grands objets permet d’ajuster le partitionnement des données pour exploiter au mieux ses points forts.
Drive Stats Q3 2025 : fiabilité des disques en chiffres
Au-delà de la performance réseau, Backblaze maintient son traditionnel rapport Drive Stats, qui recense le comportement réel des disques durs de sa plateforme. La photographie du troisième trimestre 2025 donne un état des lieux :
- Unités de stockage en fonctionnement : 328 348
- Jours de fonctionnement cumulatifs durant le trimestre : 29 431 703
- Défaillances enregistrées durant le trimestre : 1 250
- Taux de défaillance annuel (AFR) trimestriel : 1,55 %
À plus longue échéance, les chiffres de référence sont :
| Période | Jours de fonctionnement | Défaillances | AFR |
|---|---|---|---|
| T3 2025 | 29 431 703 | 1 250 | 1,55 % |
| Année 2024 | 101 906 290 | 4 372 | 1,57 % |
| Historique | 527 372 275 | 18 953 | 1,31 % |
La stabilité de la taux sur l’ensemble des années, autour de 1,3 %, témoigne d’une fiabilité constante malgré la croissance du parc et l’adoption de plus en plus de disques de grande capacité. Notons aussi l’augmentation progressive des disques de 20 To ou plus, qui dépassent maintenant 67 000 unités, soit environ 21 % de la flotte.
Le rapport mentionne aussi :
- Un « club des disques sans faille » durant le trimestre avec quatre modèles précis (dont le Seagate ST8000NM000A de 8 To et le Toshiba MG11ACA24TE de 24 To).
- Trois modèles avec un AFR exceptionnellement élevé, supérieur à 5,88 %, détectés comme des anomalies :
- Seagate ST10000NM0086 (10 To), avec 7,97 %, en moyenne plus de 7 ans d’âge.
- Seagate ST14000NM0138 (14 To), 6,86 %, avec un historique de taux de défaillance élevé.
- Toshiba MG08ACA16TEY (16 To), avec 16,95 %, en partie lié à des opérations de firmware ou de maintenance plutôt qu’à une panne mécanique massive.
Comment Backblaze définit un “défaut” de disque
La transparence du rapport inclut la façon dont la société décide qu’un disque est considéré comme défaillant d’un point de vue statistique, ce qui est moins trivial qu’il n’y paraît.
Le processus comporte trois niveaux :
- Surveillance SMART et erreurs de lecture/écriture : via des outils comme smartmontools et un système interne nommé drive sentinel qui repère erreurs irrécupérables et autres indicateurs.
- Programme podstats : qui collecte périodiquement les attributs SMART de chaque unité dans chaque Storage Pod et génère des fichiers XML centralisés.
- Niveau d’ingénierie des données : croise les données SMART avec les tickets de remplacement dans les centres de données. Un disque est considéré comme défaillant s’il disparaît des rapports tout en étant remplacé ou si, après un délai raisonnable, il ne revient pas dans le pool après maintenance.
Cette approche explique pourquoi certains pics de AFR — comme ceux des unités Toshiba en cours de mise à jour firmware — sont plus « esthétiques » qu’un véritable signe de dégradation physique. La société précise qu’elle explique cela dans le rapport afin d’éviter toute mauvaise interprétation.
Ce que tout cela signifie pour les entreprises et développeurs
Les deux rapports de Backblaze — performance et fiabilité — véhiculent un message clair : dans le cloud, il ne suffit pas de regarder le prix par gigaoctet ou de se fier à un simple chiffre de latence ou de taux de défaillance.
Pour les équipes data, responsables d’infrastructure ou projets IA, ces données permettent de :
- Comparer de manière plus transparente Backblaze B2 à AWS, Cloudflare ou Wasabi, du moins dans un cadre contrôlé.
- Comprendre le comportement de chaque fournisseur selon la taille des fichiers et le pattern d’accès (single-thread vs multi-thread), crucial pour des workloads tels que RAG, data lakes ou ingestion massive de logs.
- Évaluer la maturité opérationnelle d’un fournisseur à partir de ses chiffres AFR et de la gestion des outliers et opérations de maintenance.
Dans un contexte où beaucoup cherchent des alternatives aux hyperpuissances pour certains workloads, ces données offrent un contexte précieux pour une prise de décision éclairée.
Questions fréquentes
Quelle est la différence pratique entre le temps moyen de téléchargement et le throughput soutenu dans le cloud ?
Le temps moyen de téléchargement mesure la durée pour un seul fichier, fortement influencée par la latence réseau. Le throughput soutenu indique la quantité de MiB transférés en continu par seconde sur plusieurs minutes, en utilisant le parallélisme. Pour la sauvegarde, l’ingestion ou l’entraînement IA, le throughput est souvent un indicateur plus pertinent que la latence d’un seul fichier.
Pourquoi Backblaze utilise-t-il les MiB plutôt que les MB dans ses tests de performance ?
Le MiB (mébibyte) est basé sur des puissances de deux (1.048.576 bytes), alors que le MB (megabyte) décimal vaut 1.000.000 bytes. En stockage et performance, utiliser le MiB évite les ambiguïtés et offre des mesures plus précises pour comparer débits et tailles de fichiers dans des environnements sensibles à la performance.
Quelle fiabilité affiche Backblaze selon Drive Stats Q3 2025 ?
Avec un AFR trimestriel de 1,55 %, une valeur stable à l’année (1,57 %) et une moyenne historique de 1,31 %, la flotte de disques Backblaze affiche une fiabilité constante. La présence d’outliers ou de pics ponctuels, notamment lors de mises à jour firmware, témoigne d’un suivi actif de la santé des disques et d’une politique de remplacement claire.
Dans quels cas d’usage IA et analytique Backblaze B2 est-il le plus adapté ?
Les résultats de Performance Stats montrent que Backblaze B2 est particulièrement compétitif pour les opérations d’objets petits et en débit soutenu sur de gros fichiers, ce qui le rend pertinent pour l’inférence de modèles, RAG, feature stores, analytique de logs et stockage de contenu pour CDN. Sur tailles moyennes, d’autres fournisseurs comme AWS ou Wasabi peuvent offrir des performances équivalentes ou supérieures, donc la décision finale doit aussi prendre en compte le coût total.
Source : backblaze
Pourquoi un SSD devient-il lent après avoir cloné un HDD ? Causes réelles et comment retrouver sa vitesse