L’art de réduire les fichiers : histoire, évolution et comparaison des formats de compression les plus utilisés

L'art de réduire les fichiers : histoire, évolution et comparaison des formats de compression les plus utilisés

La compression des données, de ZIP à Zstandard, en passant par des formats disparus comme ARJ, LZH ou Quantum, a traversé une évolution fascinante sur différentes plateformes et systèmes d’exploitation.

La compression de fichiers est un élément fondamental du développement informatique, visant à réduire la taille des données pour optimiser le stockage, la transmission sur réseau et les sauvegardes. Depuis les années 1980, de nombreux algorithmes et formats ont vu le jour : certains sont aujourd’hui obsolètes, tandis que d’autres restent d’actualité et évoluent constamment.

Cet article retrace l’histoire des principaux formats de compression, en mettant en lumière certains moins connus, ainsi que leurs extensions, compatibilités, avantages, inconvénients et curiosités.

De ARC à Quantum : la préhistoire de la compression

Dans les années 80, la nécessité d’une compression efficace était cruciale pour les disquettes de 360 Ko et les connexions par modem lentes. Parmi les premiers formats se distinguent :

FormatExtensionAnnéeÉtat actuelNotes
ARC.arc1985Obsolète depuis ~1990Controverse légale ; remplacé par ZIP
ARJ.arj1990Obsolète depuis ~2000Très utilisé dans les BBS, efficace pour son temps
LZH/LHA.lzh1988Désuet depuis ~2010Populaire au Japon et sur AmigaOS
Q (Quantum).q1991Discontinué en 1994Haute compression sous MS-DOS, remplacé par ZIP
Zoo.zoo1986Obsolète depuis ~1995Format de compression pour Unix

Formats modernes et anciens : un panorama élargi

FormatExtensionCompressionAvantagesInconvénientsCompatibilitéÉtat
ZIP.zipMoyenneTrès compatible, rapideCompression moindre comparée aux autresWindows, macOS, Linux, mobilesActif
RAR.rarHauteBon ratio, récupération d’erreursPrivatifWindows, macOS, Linux (limité), apps mobilesActif
7z.7zTrès hauteOpen source, cryptage fortLent dans certains casWindows, macOS, Linux, mobilesActif
TAR.GZ.tar.gzHaute (gzip)Standard sur Linux, bonne vitessePas de navigation directeLinux, Unix, Windows avec outilsActif
XZ.xzTrès hauteExcellente compressionLent, consommateur de CPULinux, Windows, macOSActif
Zstandard.zstHauteTrès rapide, moderneAdoption encore limitéeLinux, macOS, Windows (nouvelles outils)Actif
LZMA.lzmaTrès hauteHaute compressionMoins de support que .7zLinux, WindowsActif
BZIP2.bz2HauteMeilleur que gzip, sans pertesTrès lentLinux, Windows, macOSActif
CAB.cabMoyenneFormat utilisé par Microsoft pour les installateursUniquement Windows, sans cryptageWindowsActif (usage limité)
ACE.aceHauteBon ratio, populaire dans les années 2000Abandonné, vulnérabilitésVersions anciennes de WinRARAbandonné (depuis ~2007)

Outils de compression par système d’exploitation

Windows

  • Support natif : ZIP, CAB.
  • Outils clés : 7-Zip, WinRAR, Bandizip, PeaZip.

macOS

  • Support natif : ZIP, TAR, GZ, XZ.
  • Outils : Keka, The Unarchiver, BetterZip.

Linux

  • Support complet en terminal : ZIP, 7z, TAR, GZ, BZ2, XZ, Zstandard.
  • Utilitaires : tar, gzip, xz, zstd, p7zip.

Android et iOS

  • Apps : ZArchiver, RAR pour Android, WinZip, iZip.
  • Limitations : Certains formats chiffrés ou solides nécessitent des apps payantes.

Cas curieux et records de compression

  • ENWIK8 (Wikipedia en texte, 100 Mo) :

    • ZIP : ~30 Mo
    • 7z : ~20 Mo
    • Zstandard : ~22 Mo
    • PAQ8px : 13,3 Mo
    • CMIX : jusqu’à 12,7 Mo (mais prend plusieurs heures)
  • Défis de compression : Des compétitions comme le Hutter Prize récompensent l’algorithme qui parvient à compresser au mieux une copie de Wikipedia, explorant les limites théoriques de compression sans perte.

Perspectives d’avenir

La croissance des données continue de croître. Bien que des technologies comme la compression en temps réel des systèmes de fichiers (ZFS, Btrfs, ReFS) ou la dé-duplication aient redéfini certaines dynamiques, les formats classiques restent pertinents. Des projets comme Zstandard ou ZPAQ visent un avenir avec des algorithmes plus intelligents et rapides, tirant parti des processeurs multicœurs et de la mémoire abondante.

En outre, la compression sans perte spécifique par type de contenu (comme les images PNG, vidéo AV1, audio FLAC) continue de progresser, optimisant les ressources pour chaque support.

Conclusion

Loin d’être relégués par l’avancée du matériel ou la baisse des coûts de stockage, les formats de compression demeurent un outil essentiel pour l’efficacité informatique. Que ce soit pour sauvegarder des données, envoyer des documents par e-mail ou distribuer des logiciels, le choix d’un bon format peut faire une grande différence.

De l’ancien ARJ au moderne Zstandard, la compression est un art technique qui a évolué avec chaque génération d’ordinateurs. Et au regard des avancées actuelles, elle n’a pas encore dit son dernier mot.

Sources et outils recommandés :
Via : Noticias Redes Sociales

le dernier