![]()
C. UnicodeUnicode je ╣estnßctibitov² systΘm k≤dovßnφ znak∙, kter² je urΦen pro v²m∞nu, zpracovßnφ a zobrazenφ textu v r∙zn²ch souΦasn²ch a historick²ch jazycφch. Toto k≤dovßnφ zavedlo Unicode Consorcium a nadßle ho vyvφjφ. V souΦasnΘ dob∞ je k dispozici verze 2.0, kterß je podporovanß i v Jav∞. Unicode je skoro shodn² s normou ISO 10646, kterß jej p°ejala. K≤dovßnφ znak∙ Druhou a to hlavnφ nev²hodou je malß podpora Unicode v souΦasn²ch operaΦnφch systΘmech. To je zap°φΦin∞no velkou datovou nßroΦnostφ text∙ (jsou dvakrßt del╣φ), ale hlavn∞ font∙, kterΘ by m∞ly obsahovat p°es 30 000 znak∙. Bli╛╣φ a aktußlnφ informace lze nalΘzt na [WWW17]. C.1. UTF-8Jeliko╛ je podpora Unicode zatφm velmi malß a je zapot°ebφ zajistit p°enos t∞chto znak∙ mezi platformami, byla vyvinuta k≤dovßnφ pro p°enos na systΘmech, kterΘ podporujφ jen osmibitovΘ k≤dovßnφ znak∙ (ASCII).Java nabφzφ podporu k≤dovßnφ UTF-8, co╛ je k≤d s prom∞nnou ╣φ°kou znaΦky - jeden znak m∙╛e b²t k≤dovßn jedno-, dvou- nebo t°φ-bytov∞. JednoznaΦnost k≤du umo╛≥uje p°esn∞ stanovit zaΦßtek znaku, co╛ je v²hoda p°i obnov∞ po╣kozenΘho souboru. Princip k≤dovßnφ shrnuje nßsledujφcφ tabulka:
C.2. AkcentovanΘ znaky v UnicodeV tabulce je zobrazeno k≤dovßnφ n∞kter²ch znak∙ v Unicode.
|