![]()
C. UnicodeUnicode je šestnáctibitový systém kódování znaků, který je určen pro výměnu, zpracování a zobrazení textu v různých současných a historických jazycích. Toto kódování zavedlo Unicode Consorcium a nadále ho vyvíjí. V současné době je k dispozici verze 2.0, která je podporovaná i v Javě. Unicode je skoro shodný s normou ISO 10646, která jej přejala. Kódování znaků Druhou a to hlavní nevýhodou je malá podpora Unicode v současných operačních systémech. To je zapříčiněno velkou datovou náročností textů (jsou dvakrát delší), ale hlavně fontů, které by měly obsahovat přes 30 000 znaků. Bližší a aktuální informace lze nalézt na [WWW17]. C.1. UTF-8Jelikož je podpora Unicode zatím velmi malá a je zapotřebí zajistit přenos těchto znaků mezi platformami, byla vyvinuta kódování pro přenos na systémech, které podporují jen osmibitové kódování znaků (ASCII).Java nabízí podporu kódování UTF-8, což je kód s proměnnou šířkou značky - jeden znak může být kódován jedno-, dvou- nebo tří-bytově. Jednoznačnost kódu umožňuje přesně stanovit začátek znaku, což je výhoda při obnově poškozeného souboru. Princip kódování shrnuje následující tabulka:
C.2. Akcentované znaky v UnicodeV tabulce je zobrazeno kódování některých znaků v Unicode.
|