Mi az a karakterkódolás, windsc

A számítógépek dolgozzák fel az információkat csak számszerű formában. Ezért a feldolgozó a szövegek a számítógépet, minden karakter a szöveg kell térképezni, hogy egy bizonyos számot. A táblázat a levelezés a karakterek és számok (numerikus szimbólumok kód) nevezzük karakterkódolást.

Karakterkódolást használják belépő szövegeket és dokumentumokat a számítógépbe, és megjeleníti a szöveges üzenetek és dokumentálja ember által olvasható (pl monitor, nyomtató, és így tovább. D.).

Megjegyzés. kódtáblát néha kódlapot.

típusú kódolások

Jelenleg a leggyakoribb kétféle karakterkészletek:

  • Egy byte-os kódok, amelyeket egy bájtban (8 bit) kódoló egy szimbólumot a szöveg;
  • Unicode (Unicode) - azt, hogy kódolni egy karakter a szöveg által használt két vagy négy bájt.

Egybájtos kódolás volt egészen elfogadható a legtöbb felhasználó számára - miután 256 karakter kódok kódolására elegendő szövegeket a legtöbb nyelven. De amikor a számítógépek vált széles körben használják szerte a világon, a számos egybájtos kódolás volt a több száz. Elvégre nyelven használják az emberek a sok, gyakran ezek a nyelvek saját speciális ábécé (görög, héber, és így tovább. D.), ezért nekik kell saját kódolás. Ezen kívül, gyakran egy nyelvre használatban voltak több kódolást. Mindez volt nehézségeket okoz, és zavartság, különösen akkor, ha létre többnyelvű dokumentumok és a nemzetközi kapcsolatokban. Tehát most, ahelyett, hogy sok egybájtos kódolás egyre gyakrabban használják a sokoldalú kódolása Unicode.

Unicode kódolást. Az utóbbi években egyre szélesebb körű alkalmazása az Unicode (Unicode). Ez általában két bájt kódolásához használt minden egyes karakter, és egyes karakterek - 4 bájt (két byte nem volt elég).

A Unicode kódokat használják szinte minden karakter (az ábécé különböző nyelveken, a matematika, dekoratív jelek és így tovább. D.). Ez nagyon kényelmes, sok új programok kódolásához szöveges adatok Unicode.