Veszteségmentes tömörítés wikipedia
Ebben a kifejezést, vannak más célra, lásd. Tömörítés.
veszteségmentes tömörítést használják számos alkalmazásban. Például, hogy használják az összes fájl archiváló. Azt is használják, mint egy komponens veszteséges tömörítés.
Veszteségmentes tömörítést használnak, ha a személyazonosságát a fontos tömörített adatokat az eredeti. Egy hétköznapi példa - a bináris és a forráskódot. Egyes grafikus fájlformátumot (például PNG) csak veszteségmentes tömörítést, míg mások (TIFF. MNG vagy GIF fájlok) használhatják tömörítés, mint a veszteséges és veszteségmentes.
A tömörítés és a kombinatorika [| ]
Ez könnyű bizonyítani a tétel.
Minden n> 0 van egy veszteségmentes tömörítési algoritmus, amely:
- Bármely fájlt, amely nem hosszabb, mint az N bájt, vagy elhagyja az azonos hosszúságú, vagy csökkenése.
- A fájl nem hosszabb, mint N. csökkentjük legalább egy bájt.
Bizonyítás. Az általánosság elvesztése nélkül, akkor feltételezhetjük, hogy a fájl egy csökkent hossza pontosan N. Legyen az ábécé, mint a # X03A3; . Fontolja meg a készlet # X03A3; 0 # X222A; # X03A3; 1 # X222A; # X2026; # X222A; # X03A3; N # X2212; 1 # X222A; \ Cup \ Sigma ^ \ cup \ ldots \ cup \ Sigma ^ \ cup \>. Ebben a készlet 256 0 + 256 1 + # X2026; 256 N + # X2212; 1 + 1 256 ^ + \ ldots + 256 ^ + 1> forrás fájlokat, miközben nem tömörített több, mint 256 256 0 + 1 + # X2026; 256 N + # X2212; 1 +256 ^ + \ ldots + 256>. Ezért a dekompressziós funkció nem egyértelmű. ellentmondás. Ez azt bizonyítja, a tétel.
Azonban ez a tétel nem vet árnyékot a veszteségmentes tömörítés. A tény az, hogy bármely tömörítési algoritmus lehet módosítani úgy, hogy növeli a mérete nem nagyobb, mint 1 bit: ha az algoritmus csökkenti a fájlt, írjon „1”, akkor a tömörített szekvenciát, ha fokozott - írja a „0”, akkor az eredeti.
Tehát összenyomhatatlan töredékek nem vezet az ellenőrizetlen „felfújja” az archívumban. „Valódi” az N hosszúságú fájlok jóval kevesebb, mint 256 N> (azt mondják, hogy ezek az alacsony információs entrópia) - például nem valószínű, hogy a betű- „NULL” találkozott értelmes szöveget, és a digitális audio szintek nem egy minta ugrani 0 és 100%. Ezen kívül, mivel a szakosodás egy bizonyos típusú adatok algoritmusok (.. szöveg, grafika, hang, stb) is lehetséges, hogy magas fokú tömörítés: például értékelik az archiváló egyetemes algoritmusok tömöríteni a hangot mintegy egyharmada (1,5-szeres) míg FLAC - 2,5-szeres. A legtöbb speciális algoritmusok kevés hasznát a fájlok „idegen” típusok: például az audió adatok nem tömöríti algoritmust, amelynek célja a szövegeket.
veszteségmentes tömörítési eljárás [| ]
Általában, a jelentése veszteségmentes tömörítés, hogy a megállapítás minden szabályosságát, és ennek fényében törvényszerűségek generál egy második szekvencia az eredeti adatokat, amely teljes mértékben leírja az eredeti. Például, hogy kódolja a bináris jelsorozat, amelyben a nullák száma és a kis egységek, tudjuk használni ezt a csere:
Ebben az esetben a tizenhat bit
Úgy kell átalakítani, hogy tizenhárom bit
Ez a szubsztitúció, egy előtag kódot. vagyis van egy ilyen funkció: ha írunk egy rövid sort, szóköz nélkül, akkor is képes, hogy azt a hézagokat -, és visszaállítja az eredeti sorrendet. A legtöbb jól ismert előtag kód egy Huffman-kód.
A legtöbb veszteségmentes tömörítési algoritmusok munka két szakaszban történik: az első generálja egy statisztikai modell a bejövő adatokat, és a második megjeleníti a bejövő adatokat bináris ábrázolás, a modell segítségével a „valószínűség” (azaz közös) adatokat, amelyeket gyakrabban, mint a „nem a valószínűsége” .
Statisztikai modell algoritmusok szöveges (bináris vagy szöveges adatok, mint például a végrehajtható fájlokat) a következők:
Algoritmusok előállító kódoló bitsorozatot keresztül:
veszteségmentes tömörítési módszerek [| ]
Add linkek forrásokból. amelynek tárgya a téma ezt a cikket (vagy szakasz), mint egész, adatokat tartalmazó lista elemeit példaként. Ellenkező esetben a partíció törölhető.
Többcélú [| ]
- Run Length Encoding - egyszerű áramkört, ami a jó tömörítés, amelyek sok ismétlődő értékeket
- LZW - használt gif, és még sokan mások.
- Kienged - használt gzip, a továbbfejlesztett változata a zip és PNG részeként a tömörítési eljárás.
- LZMA - használt 7-zip.
Hangtömörítési [| ]
Sűrített grafikák [| ]
szöveg tömörítés [| ]
Példák algoritmusok [| ]
- A család a Lempel-Ziv algoritmus
- RLE (run-length kódolás - hosszúságú kódolás)