Karakterkódolás - ez

Állítsa be a karakterek (angol karakterkészlet.) - asztali meghatározott véges halmaza karakterkódolást. Ez a táblázat összehasonlítja az egyes karaktereket hossza egy vagy több byte.

Gyakran előfordul, hogy még helyett a „karakterkészlet” helytelenül használják a „kódlap”, ami azt jelenti, valójában egy speciális esete egy byte-os karakterkészlet kódolását.

Jelenleg főleg háromféle titkosítási: Kompatibilis EBCDIC és Unicode alapú 16 bites, a túlnyomó túlsúlya az első. Bemutatása Unicode kompatibilis ASCII. Alapuló kódolás DKOI-8) használnak egyes mainframe. Kezdetben egy készlet szimbólumok által használt operációs rendszer. Most használják karakterkészletek [5]. függ az operációs rendszer típusát csak a hagyomány és megfelelően lesz beállítva locale.

Wikipedia és egyéb projektek a Wikimedia Foundation Unicode UTF-8.

Automatikus felismerés kódolások

A több karakterkészletek a mai program létrehoz egy csomó kellemetlenséget, nem csak a programozók. hanem a felhasználók számára. Az egyik nézet hoppá, szemét képes megbirkózni, ha a program automatikusan felismeri a kódolási bejövő szöveget.

Egybájtos kódolású lehet fordítani arra a tényre, hogy a frekvencia használatának különböző betűk nagyon különböző (például a Magyar gyakran használják az „on”, de ritkán „b”). Ezért, ismerve a szöveg nyelvét, akkor könnyen kiválaszthatja a karakterkódolást, amelyben a frekvencia bájtok jobban megfelel a frekvencia betűk a nyelvet.

Egy másik nézet tartja az ilyen heurisztikus algoritmusokat, hogy meghatározza a szöveges kódolás káros, mert a modern információs technológiák segítségével összehasonlítani a rendelkezések szövegét kifejezetten neki a kódot oldalon (lásd. Pl létrehozása szöveges adatok programokat, amelyek megsértik a szabványoknak.

gyakori kódolási

  • ISO 646
    • EBCDIC
    • ISO 8859.
      • ISO 8859-1. ISO 8859-2. ISO 8859-3. ISO 8859-4. ISO 8859-5. ISO 8859-6, az ISO 8859-7, ISO 8859-8, ISO 8859-9, ISO 8859-10, 8859-11 ISO, ISO 8859-13, 8859-14 ISO, ISO 8859-15
      • CP850, CP852, CP866, CP869
    • Kódoló Microsoft Windows.
      • A Windows-1252 Nyugat nyelven
      • Windows 1254 a török ​​nyelv
      • Windows 1255 héber
      • Windows 1256 arab
      • Windows 1257 balti nyelvek
      • Windows 1258 vietnami
    • MacRoman, KOI8 (KOI8-R, KOI8-U ...), koi7
    • bolgár kódolás
    • ISCII
    • VISCII
    • Big5 (a leghíresebb változata a Microsoft CP950)
      • GB2312
      • GBK (Microsoft CP936)
      • GB18030
    • Shift JIS japán (Microsoft CP932)
    • EUC-KR a koreai (Microsoft CP949)
    • ISO-2022 és EUC a kínai írás
    • UTF-16 kódolású Unicode karakterkészlet

    jegyzetek

    Lásd, amit a „karakterkódolás” más szótárak:

    Kódolás a magyar nyelv a számítógépes programok és az internet - - Minden karakter lehet megjeleníteni a számítógép képernyőjén leírása a szimbólumtáblába. A legelső asztalnál karakterek nem magyar betűket. Annak érdekében, hogy működjön együtt a magyar betűkkel kellett belépni ebbe a karakterkészlet helyett felesleges ... ... Collegiate Dictionary média

    Kódolás - A karakterek (angol karakterkészlet.) Táblázat egyes véges halmaza karakterkódolást. Ez a táblázat összehasonlítja az egyes karaktereket hossza egy vagy több byte. Bár a "karakterkészlet" (eng. Character set, ... ... Wikipedia

    Alternatív kódolás - Ellenőrizze az információt. Meg kell vizsgálni, a pontosság a tények és az információk pontosságát az ebben a cikkben. Az oldalon a vita kell magyarázat. „Alternatív kódolás” alatt ... Wikipedia

    Character Set - (. Angol karakterkészlet) táblázatot, amely megadja a kódolás egy véges ábécé karakter (általában szöveges elemek: betűk, számok, írásjelek). Ez a táblázat összehasonlítja az egyes karaktereket hossza egy vagy több ... ... Wikipedia

    A hat bites kódolás - a hat bites kódolás használt számítógépek, gyártották az USA-ban az 1950-es 1960-as években. Ennek megfelelően, a gépi szó mérete ezeknek számítógépek többszöröse 6 bitet (például 12, 18, 24, 36, 48, 60 bit). Ez a szimbólum mérete lehetővé tette ... ... Wikipedia

    Az alapvető kódolás - GOST 19768 87 fogadták 1987 helyére KOI 8, de kevés használt. Alapvető kódolás csak támogatja a hardver és szoftver, hogy készül a Szovjetunió (EU PC, Lexicon, ...), valamint egyes nyomtatók Epson ... Wikipedia

    UTF-8 - (. Az angol Unicode Transformation Format, 8 bit «Unicode Transformation Format, 8-bites") közös kódolása Unicode karakterek, amely kompatibilis a 8-bites formátumú átvitel szöveget. Már széles körben használják az operációs ... ... Wikipedia

    • Alternatív kódolás. Dzhessi Rassel. Ez a könyv lesz összhangban a rendelését Technology Print-on-Demand technológiát. High Quality Content Wikipedia cikket! „? Vnaya alternatívák kódol Application” - alapján a CP437 ... Tovább Vásárlás 998 rubelt