..


Liens sponsorisés

Compresser des fichiers. Algorithmes et logiciels pour la comparaison.

Article écrit par Damiano Verda
Page 1 sur 2

Parmi les opérations les plus courantes qui peuvent être utiles, même pour des utilisateurs non qualifiés d'identifier définitivement la compression. Grâce à cette transaction, en fait, n'importe quel fichier sur votre ordinateur peut être restauré, de manière à occuper une portion de mémoire que le disque dur. Nous observons cependant que, actuellement, il ya des disques dur de grande capacité disponibles à des prix assez bas, donc l'utilité des programmes de compression semble se rétrécir. Mais c'est une conclusion hâtive.

En fait, par exemple, peut être intéressant de compresser un ou plusieurs fichiers avant de les envoyer par e-mail, afin de réduire le temps de réception et de transmission. Ajout intéressant et pratique également la possibilité de stocker plusieurs documents en un seul fichier compressé, plus pratique à transmettre et à manipuler.

Mais quelles sont les principales options disponibles pour les utilisateurs de compresser un fichier ou un dossier? Ce qui distingue les différents logiciels disponibles? Examinons d'abord le fondement théorique de la compression logicielle, illustrant ainsi les principales caractéristiques des algorithmes de compression.

Les algorithmes de compression

Une première distinction parmi les algorithmes de compression peuvent être identifiées entre les algorithmes de compression sans perte, c'est à dire sans aucune perte de qualité et d'algorithmes avec perte, dans laquelle la réduction de l'espace disque est accompagné d'une perte de qualité. Il est souvent difficile de percevoir une détérioration de la qualité: par exemple dans le cas de l' encodage MP3 pour les fichiers audio.

Parmi les algorithmes les plus largement utilisés identifier sans aucun doute le «algorithme de Huffman, le« algorithme de Shannon-Fano et «l'algorithme Lempel, Ziv et Welch. Sans entrer dans des explications théoriques, nous examinons les principales caractéristiques de «l'algorithme de Huffman, qui a marqué l'histoire des techniques de compression.

Nous renvoyons le lecteur intéressé par de plus amples détails sur les techniques de Shannon-Fano et Lempel-Ziv-Welch liens plus spécifiques sur ce sujet:

L'algorithme de Huffman

Algorithme de 'S appartient à la catégorie de Huffman lossless, c'est à dire ne pas introduire de perte de qualité. Nous scomporne opération en cinq étapes élémentaires:

  • Est analysé et compté le nombre d'occurrences des éléments de base du fichier à compresser: les caractères individuels dans un fichier texte, les pixels dans un fichier image.
  • Les deux éléments sont réunis dans une catégorie moins fréquent, qui représente les deux. Ainsi, par exemple si X et Y se produit 8 fois 7 fois, il crée le XY catégorie, avec 15 récidives. Pendant ce temps, les composantes X et Y reçoivent chacun un marqueur différent qui les identifie comme des éléments entrés dans une association ».
  • Les deux points suivants sont identifiés moins fréquentes dans le dossier et siège en tant que nouvelle catégorie, en utilisant la même procédure décrite à l'étape 2. Le XY groupe peut à son tour entrer et former de nouvelles associations, par exemple, la catégorie XYZ. Lorsque cela arrive, le X et Y sont donné un nouvel identifiant qui se termine avec l'Association d'étendre le code qui identifie chacune des deux lettres dans le fichier compressé sera généré.
  • Est alors créée pour les prochaines étapes, un arbre est constitué d'une série de branches binaire, dans lequel apparaissent plus fréquemment et dans des combinaisons ultérieures éléments les plus rares dans le fichier, tandis que les éléments sont rarement plus fréquentes. Selon le mécanisme décrit, cela signifie que les éléments rares dans les fichiers décompressés sont associés à une longueur de code d'identification, qui se développe chaque élément d'une nouvelle association. Les éléments sont répétés plus souvent au lieu du fichier d'origine ne sont pas présents dans l'arbre »des associations, afin que leur code d'identification sera aussi courte que possible.
  • Un fichier compressé est générée, en remplacement de chaque élément du fichier original, le code produit à la fin de la chaîne d'associations fondées sur la fréquence de cet élément dans le document source.
Le gain d'espace à la fin de la compression est due au fait que les éléments qui se répètent souvent, sont identifiés par un code court, ce qui prend moins de place que qu'ils occupent leur encodage normal. Inversement éléments rares dans le fichier original dans le fichier compressé de recevoir un code de long, qui peut exiger, pour chacun d'eux, un espace considérablement plus grand que celui occupé dans le fichier non compressé.

De la somme algébrique de l'espace gagné par le codage des courts les plus fréquents et de l'espace perdu avec l'encodage de la longue les plus rares que vous obtenez le taux de compression produite par «algorithme de Huffman. De ce qui précède, il s'ensuit que ce type de compression est plus efficace l'ensemble des différences de fréquence des composants du fichier original, tandis que les mauvais résultats sont obtenus lorsque la distribution des éléments est uniforme.

Dans la même catégorie ...
E-Learning
HTML (Cours) HTML (Cours)
Le langage de balisage pour le Web à partir de 29 €.
Webmaster avancée (Cours) Webmaster avancée (Cours)
Devenez un Webmaster professionnel. A partir de 39 €.
Webmaster de base (d'abord) Webmaster de base (d'abord)
Créer un site Web à partir de zéro. A partir de 29 €.
Liens sponsorisés