Dal╣φ P°edchozφ Obsah

10. Konverze znakov²ch sad

Pro konverzi textov²ch soubor∙ se pou╛φvß GNU program recode. Mezi Φesk²mi a slovensk²mi u╛ivateli je ov╣em mnohem oblφben∞j╣φ program cstocs, kter² byl zpoΦßtku k dispozici jako samostatn² balφΦek, pozd∞ji byl zaΦlen∞n do cs-tools. Jde o skripty v jazyce perl a awk schopnΘ konvertovat textovΘ soubory bu∩ pomocφ p°evodu one-to-one nebo one-to-many. P°i p°evodu one-to-many se nap°φklad konvertuje znak Copyright (C v krou╛ku) do ASCII jako (c), n∞meckΘ ostrΘ s se nahrazuje ss apod.. Aktußlnφ verze cstocs (pro Perl 5) je souΦßstφ novΘ distribuce Cstools, kterou je mo╛nΘ nalΘzt na libovolnΘm zrcadle CPANU na http://www.perl.com/CPAN/authors/id/JANPAZ/.

Star╣φ verze, cstocs-3.0, kterß je tΘ╛ souΦßstφ cs-tools-0.19, pracuje i s Perlem 4 a obsahuje tΘ╛ skripty pro awk. Je k dispozici na ftp://ftp.muni.cz/pub/localization/linux/obsolete/cs-tools/. V tΘto verzi je chyba. V souboru 1250.enc je t°eba smazat poslednφ prßzdn² °ßdek. Pokud mß program slou╛it pro p°evod text∙ v n∞mΦin∞, bude navφc vhodnΘ zm∞nit v souborech kam.enc a vga.enc popis znaku beta na ssharp, aby byl pova╛ovßn za n∞meckΘ ostrΘ s, kterΘ bude p°i p°evodu one-to-many nahrazeno dv∞ma znaky s, jak je zvykem v n∞mΦin∞, p°φpadn∞ v souboru accent definovat nßhradu [AOUaou]diaeresis dvojicφ [AOUaou]e.

Pokud nem∙╛ete pou╛φt ani perl ani awk, je mo╛nΘ pou╛φt program sed a jeden ze skript∙ z adresß°e ftp://ftp.fi.muni.cz/pub/localization/charsets/sed/, kterΘ se pou╛φvajφ takto:


sed -f pclat2.isolat2 soubor > vystup


Dal╣φ P°edchozφ Obsah