Veszteségmentes tömörítés wikipedia

Ebben a kifejezést, vannak más célra, lásd. Tömörítés.

veszteségmentes tömörítést használják számos alkalmazásban. Például, hogy használják az összes fájl archiváló. Azt is használják, mint egy komponens veszteséges tömörítés.

Veszteségmentes tömörítést használnak, ha a személyazonosságát a fontos tömörített adatokat az eredeti. Egy hétköznapi példa - a bináris és a forráskódot. Egyes grafikus fájlformátumot (például PNG) csak veszteségmentes tömörítést, míg mások (TIFF. MNG vagy GIF fájlok) használhatják tömörítés, mint a veszteséges és veszteségmentes.

A tömörítés és a kombinatorika [| ]

Ez könnyű bizonyítani a tétel.

Minden n> 0 van egy veszteségmentes tömörítési algoritmus, amely:

  1. Bármely fájlt, amely nem hosszabb, mint az N bájt, vagy elhagyja az azonos hosszúságú, vagy csökkenése.
  2. A fájl nem hosszabb, mint N. csökkentjük legalább egy bájt.

Bizonyítás. Az általánosság elvesztése nélkül, akkor feltételezhetjük, hogy a fájl egy csökkent hossza pontosan N. Legyen az ábécé, mint a # X03A3; . Fontolja meg a készlet # X03A3; 0 # X222A; # X03A3; 1 # X222A; # X2026; # X222A; # X03A3; N # X2212; 1 # X222A; \ Cup \ Sigma ^ \ cup \ ldots \ cup \ Sigma ^ \ cup \>. Ebben a készlet 256 0 + 256 1 + # X2026; 256 N + # X2212; 1 + 1 256 ^ + \ ldots + 256 ^ + 1> forrás fájlokat, miközben nem tömörített több, mint 256 256 0 + 1 + # X2026; 256 N + # X2212; 1 +256 ^ + \ ldots + 256>. Ezért a dekompressziós funkció nem egyértelmű. ellentmondás. Ez azt bizonyítja, a tétel.

Azonban ez a tétel nem vet árnyékot a veszteségmentes tömörítés. A tény az, hogy bármely tömörítési algoritmus lehet módosítani úgy, hogy növeli a mérete nem nagyobb, mint 1 bit: ha az algoritmus csökkenti a fájlt, írjon „1”, akkor a tömörített szekvenciát, ha fokozott - írja a „0”, akkor az eredeti.

Tehát összenyomhatatlan töredékek nem vezet az ellenőrizetlen „felfújja” az archívumban. „Valódi” az N hosszúságú fájlok jóval kevesebb, mint 256 N> (azt mondják, hogy ezek az alacsony információs entrópia) - például nem valószínű, hogy a betű- „NULL” találkozott értelmes szöveget, és a digitális audio szintek nem egy minta ugrani 0 és 100%. Ezen kívül, mivel a szakosodás egy bizonyos típusú adatok algoritmusok (.. szöveg, grafika, hang, stb) is lehetséges, hogy magas fokú tömörítés: például értékelik az archiváló egyetemes algoritmusok tömöríteni a hangot mintegy egyharmada (1,5-szeres) míg FLAC - 2,5-szeres. A legtöbb speciális algoritmusok kevés hasznát a fájlok „idegen” típusok: például az audió adatok nem tömöríti algoritmust, amelynek célja a szövegeket.

veszteségmentes tömörítési eljárás [| ]

Általában, a jelentése veszteségmentes tömörítés, hogy a megállapítás minden szabályosságát, és ennek fényében törvényszerűségek generál egy második szekvencia az eredeti adatokat, amely teljes mértékben leírja az eredeti. Például, hogy kódolja a bináris jelsorozat, amelyben a nullák száma és a kis egységek, tudjuk használni ezt a csere:

Ebben az esetben a tizenhat bit

Úgy kell átalakítani, hogy tizenhárom bit

Ez a szubsztitúció, egy előtag kódot. vagyis van egy ilyen funkció: ha írunk egy rövid sort, szóköz nélkül, akkor is képes, hogy azt a hézagokat -, és visszaállítja az eredeti sorrendet. A legtöbb jól ismert előtag kód egy Huffman-kód.

A legtöbb veszteségmentes tömörítési algoritmusok munka két szakaszban történik: az első generálja egy statisztikai modell a bejövő adatokat, és a második megjeleníti a bejövő adatokat bináris ábrázolás, a modell segítségével a „valószínűség” (azaz közös) adatokat, amelyeket gyakrabban, mint a „nem a valószínűsége” .

Statisztikai modell algoritmusok szöveges (bináris vagy szöveges adatok, mint például a végrehajtható fájlokat) a következők:

Algoritmusok előállító kódoló bitsorozatot keresztül:

veszteségmentes tömörítési módszerek [| ]

Add linkek forrásokból. amelynek tárgya a téma ezt a cikket (vagy szakasz), mint egész, adatokat tartalmazó lista elemeit példaként. Ellenkező esetben a partíció törölhető.

Többcélú [| ]

  • Run Length Encoding - egyszerű áramkört, ami a jó tömörítés, amelyek sok ismétlődő értékeket
  • LZW - használt gif, és még sokan mások.
  • Kienged - használt gzip, a továbbfejlesztett változata a zip és PNG részeként a tömörítési eljárás.
  • LZMA - használt 7-zip.

Hangtömörítési [| ]

Sűrített grafikák [| ]

szöveg tömörítés [| ]

Példák algoritmusok [| ]

  • A család a Lempel-Ziv algoritmus
  • RLE (run-length kódolás - hosszúságú kódolás)

Példák formátumok és megvalósítások [| ]

Lásd még [. | ]

Megjegyzések [| ]