Jiº vid╪né - tak zní otrock∞ p²eklad francouzského déja vu. ªe se tento v∞raz ocitl p²ímo v názvu p²ekladatelského nástroje, kter∞ vám nyní p²edstavíme, není náhoda. Produkt totiº umoºσuje automaticky vyvolat p²eklad textov∞ch sentencí, které uº byly p²eloºeny n╪kdy d²íve. Jak po n╪jaké dob╪ jeho pouºívání stoupne produktivita p²ekladu, snad není t²eba zdàrazσovat.
P²ekladatel pot²ebuje pam╪£...
Computer Aided Translation, zkrácen╪ CAT, je snad jedno z posledních odv╪tví computer science, které je na naτem teritoriu známo spíτe z odborn∞ch zahraniƒních ƒasopisà neºli z kaºdodenní praxe. "Zásluhu" na tom mají také dovozci, hnaní vidinou rychl∞ch a co moºno nejv╪tτích ziskà. Kdejak∞ málo uºiteƒn∞ ƒi naprosto neuºiteƒn∞ software se dováºí, i kdyº objem prodeje je posléze nevaln∞, na nástroje CAT vτak zrak dovozcà zatím nepadl.
A p²itom je - v souƒasném stadiu naτeho snaºení o vstup do Evropy - potenciál zdejτího trhu nezanedbateln∞. Statisíce slov vτech moºn∞ch materiálà EU, které je zapot²ebí p²eloºit p²ed vstupem, a potom desetitisíce, které se budou m╪síc co m╪síc p²ekládat, p²i pouºívání pouhého textového editoru urƒit╪ kvalitn╪ nep²eloºí ani celé t∞my p²ekladatelsk∞ch "Einsteinà".
Druh∞m momentem, kter∞ mluví pro urychlené rozτí²ení t╪chto produktà v naτich konƒinách, je globalizace. Zde lze jiº hovo²it o informaƒním toku obousm╪rném. Jak p²i dovozu, tak p²i v∞vozu je nezbytn╪ nutné, aby pokud moºno maximum pràvodní dokumentace, se kterou p²ichází uºivatel do styku, bylo v jeho rodném jazyce. A nesmí p²itom jít o p²eklad podpràm╪rn∞, kter∞ pak kupujícího spíτe odradí.
Jak màºe CAT pomoci?
CAT p²ináτí do p²ekladatelského oboru hned n╪kolik dàleºit∞ch funkcí:
Stejnou p²ekladovou jednotku (nejƒast╪ji v╪tu) p²ekládá uºivatel nebo celá skupina uºivatelà, kte²í pracují v síti nad spoleƒnou p²ekladovou pam╪tí, pouze jedinkrát. Od okamºiku odeslání hotového p²ekladu této jednotky do p²ekladové pam╪ti se p²i p²íτtím v∞skytu ve v∞chozím textu bu╘ automaticky nabídne, nebo - pouºijeme-li funkce p²edzpracování p²ekladu - rovnou se do textu dosadí, takºe p²ekladatel zpracovává jen nové jednotky.
Z p²ekladové pam╪ti se vyhledávají a nabízejí p²ekladateli k vyuºití i podobné p²ekladové jednotky. Nástrojem je fuzzy porovnávání s nastavitelnou hladinou podobnosti.
Ob╪ tyto funkce mají spoleƒn∞ vliv na p²ekladatelskou práci - zvyτují produktivitu. Zejména v oblasti technick∞ch textà, které jsou sice odborn╪ nároƒné, ale slohov╪ rozhodn╪ netrpí "jiráskovsk∞m" stylem, je jistá opakovatelnost tak²ka pravidlem.
Dalτí pomàckou, jejíº v∞hoda vynikne zejména p²i práci v síti, je terminologická databáze. P²ínos je z²ejm∞: zv∞τení kvality p²ekladu. Pouºitelnost této funkce zahrnuje veτkeré odborné texty, od technick∞ch aº po právnickou literaturu. Práv╪ nehomogenní p²eklad dokumentace, a£ je to "odkalovací ventil" v první kapitole, "odvzduτσovací" ve t²etí, nebo "vypouτt╪cí" v poslední (stále pro tutéº souƒástku), màºe vést aº k naprostému zmatení uºivatele v∞robku - p²itom samostatn╪ kaºd∞ z t╪chto p²ekladà je v podstat╪ správn∞. Pokud se paré dokumentace rozd╪lí mezi více p²ekladatelà, b∞vá tento jev tou nejƒast╪jτí vadou.
Stejné chyby nacházíme i v p²ekladech právnick∞ch dokumentà, zejména zákonà, které agentury klidn╪ rozd╪lí mezi p╪t a více p²ekladatelà, jen aby splnily dodací lhàtu a nemusely platit p²ekladatelàm za sp╪τnost. Jedin∞m nástrojem, kter∞ zde màºe zajistit pot²ebnou homogenitu, je dàsledné pouºívání terminologické databáze. P²itom musí tato databáze pokud moºno "napovídat" sama, aniº by se jí musel p²ekladatel v╪dom╪ dotazovat.
Stejn╪ jako jiné systémy IT musí se i CAT systém v p²echodném období svého nasazování n╪jak vyrovnat s d²ív╪jτími znalostmi. Proto vτechny dobré produkty tohoto typu nabízejí funkci zaƒlen╪ní historick∞ch p²ekladà, tj. p²ekladà, u nichº je p²edem znám text v∞chozí i cílov∞, do p²ekladové pam╪ti.
Déja Vu Interactive
Déja Vu je (doufejme) prvním z CAT nástrojà, které ƒtená²àm postupn╪ p²edstavíme. Produkt není lokalizován; zàstaneme proto n╪kde u anglick∞ch názvà funkcí, nebo£ pouh∞ p²eklad by mohl b∞t zavád╪jící. Na úvod n╪kolik definic:
Projekt: N╪kolik souborà pro téhoº odb╪ratele nebo majících spoleƒn∞ terminologick∞ základ. Musí b∞t v jednom v∞chozím formátu (DOC, RTF, HLP atd.). Jednu p²ekladovou pam╪£ màºe sdílet více projektà. V rámci jednoho projektu màºe b∞t více cílov∞ch jazykà. Do projektu se importují soubory v∞chozího jazyka. Tím je zajiτt╪na ochrana v∞chozího souboru v kaºdém okamºiku práce na projektu.
P²edm╪t: Klasifikace p²ekládaného tématu. Lze ji pouºít bu╘ p²eddefinovanou, nebo si vytvo²it klasifikaci vlastní.
Klient: Odb╪ratel. Spoleƒn╪ s p²edchozím pojmem umoºσuje rozliτovat v∞razy cílového jazyka bu╘ oborov╪, nebo podle odb╪ratelà.
P²ekládan∞ segment:
Θsek textu mezi odd╪lovaƒi (nejƒast╪ji v╪ta nebo její ƒást).
Základní kameny
Jako vysp╪l∞ produkt nabízí DéjΩ Vu samoz²ejm╪ vτechny ƒinnosti zmiσované v úvodní ƒásti ƒlánku. P²ekladová pam╪£ (Memory Database = MD) je soubor, kter∞ obsahuje dvojice v╪t v∞chozích a cílov∞ch. Kaºdá v╪ta má p²íznak p²edm╪tu a klienta. P²eloºené v╪ty uºivatel odesílá do MD bu╘ po jedné, s moºností odeslat cel∞ soubor po provedené korektu²e (jak pravopisné, tak i stylistické), nebo zcela automaticky (nutno nastavit ve volbách) p²i p²echodu na následující segment. Mimo dobu p²ekladu je moºné MD obhospoda²ovat programem údrºby (Memory Maintenance). Tento program zajiτ£uje i spojení (Align) historick∞ch p²ekladà nacházejících se v samostatn∞ch souborech, a£ jiº po²ízen∞ch v textovém editoru, nebo naskenovan∞ch. Po²ízen∞ soubor lze k jin∞m úƒelàm i exportovat.
Terminologická databáze (Terminology Database = TD) je soubor, kam se ukládají dvojice v∞razà - jedno slovo aº celá v╪ta. Kaºdá dvojice vedle p²íznaku p²edm╪tu a klienta màºe obsahovat i gramatické informace (rod, slovní druh). O údrºbu TD se stará Terminology Maintenance. Lze jím importovat v n╪kolika formátech (TXT, XLS, MDB a dalτích) slovníkové soubory, které p²ekladatel po²ídil za dobu práce s textov∞m editorem. Ve v∞τe uveden∞ch formátech lze i exportovat. Samoz²ejm╪ lze do TD vkládat i v pràb╪hu p²ekladu (zajiτt╪ní homogenity p²ekladu názvà voleb, funkcí ap. p²i lokalizaci produktu).
Funkce
Rozτí²ení p²ekladu (Propagate) rozτí²í jiº hotov∞ p²eklad v╪ty bu╘ do daného souboru, nebo do celého projektu. Slouºí k zrychlení p²ekladu, nebo£ shodné v╪ty se p²eloºí na vτech místech svého v∞skytu.
P²edzpracování p²ekladu (Pretranslate) p²ed zapoƒetím p²ekládání souboru dosazuje z p²ekladové pam╪ti jiº hotové p²eklady. µet²í ƒas v p²ípad╪, kdy p²ijdeme k rozpracovanému projektu s dalτími soubory (je to stejné, jako kdyº v p²ekladu systematicky pouºíváme postupn╪ funkci Propagate). V rámci této fáze je moºné do cílového textu kopírovat bu╘ jen p²eklady identick∞ch v∞chozích textà, nebo i texty splσující nastavitelné kritérium podobnosti (fuzzy porovnávání).
Sestavení cílového segmentu (Assemble) nastupuje v okamºiku, kdy není k dispozici jiº hotov∞ p²eklad celého segmentu nebo jeho ƒásti, na n╪jº by zabralo fuzzy hledání. P²itom v TD jsou k dispozici ƒásti (sousloví) a zbytek segmentu obsahuje více slov, která se nebudou p²ekládat (nap². v návodech k pouºití je to identifikace souƒástí apod.). Za této situace funkce p²ináτí zrychlení. V b╪ºn∞ch textech ƒist╪ lexikálních není vhodná, nebo£ provádí vlastn╪ jen substituci.
Automatické vyhledávání (AutoSearch) je funkce, která s naràstajícím poƒtem p²eloºen∞ch segmentà stále zefektivσuje práci. Zapíná se ve volbách. P²i p²echodu na následující segment automaticky nabízí nalezené poloºky, a to jak z MD, tak z TD.
Ale pozor - s rostoucí dimenzí obou databází postupn╪ rostou i nároky na v∞konnost poƒítaƒe! Na Pentiu 100 je pouºití funkce skoro vylouƒeno. Na Pentiu II 233 se p²ekládaly texty do 4000 slov (MD) s celkem snesitelnou odezvou. Jakmile vτak byl do TD importován slovník o rozsahu p²es 15 000 dvojic v obou jazycích, PII/233 zaƒalo mít citelné prodlevy (u v╪ty 23 slov dlouhé p²es 16 sekund) a pracovní pohodu navrátil teprve p²echod na Celeron 400 MHz se 128 MB pam╪ti.
Dalτí podmínkou efektivního vyuºití této funkce je velikost obrazovky. Má-li totiº p²ináτet zrychlení práce, musí b∞t okna viditelná souƒasn╪, bez jakéhokoli p²epínání z liτty aplikací. Obrazovka by tedy m╪la mít minimáln╪ 17palcovou úhlop²íƒku, optimální by byla 19palcová.
Dalτí funkce, Learn, vyhledá v MD sousloví p²eloºené jiº d²íve a u CAT programà je zatím ojedin╪lá Ostatní produkty vyºadují, aby sousloví bylo v TD.
Funkce Najdi/nahra╘ (Find/Search), b╪ºná v kaºdém tetxovém editoru, má zde jednu zvláτtnost, která u ostatních produktà neb∞vá vºdy k dispozici - hledání ve v∞chozím jazyce a opravy v jazyce cílovém. Je velmi vhodná, jestliºe po p²eloºení n╪kolika souborà dodateƒn╪ zjistíme, ºe urƒit∞ odborn∞ termín má odliτn∞ p²eklad, a pot²ebujeme realizovat tuto opravu v celém projektu. Lze to provést i v p²ípad╪, ºe pàvodní p²eklady nebyly stejné.
Odd╪lovaƒe, definice pravidel a v∞jimek slouºí k d╪lení v∞chozího textu. Nechceme-li nap². po importu text procházet a znovu spojovat v╪ty rozd╪lené teƒkou za po²adov∞m ƒíslem uprost²ed v╪ty, definujeme v∞jimku "ned╪lit, pokud teƒce p²edchází ƒíslice".
V t╪chto v∞razech lze jako prom╪nné pouºít symboly pro libovolnou ƒíslici ƒi písmeno, pro malé/velké písmeno nebo libovoln∞ znak.
Spojení/rozd╪lení p²ekládaného segmentu - pokud se ve v∞chozím textu vyskytne odd╪lovaƒ (nap². teƒka) na jiném míst╪, neº je podchyceno pravidly a v∞jimkami z p²edchozího odstavce, lze spojit dva a více segmentà v jeden.
Obrácení databáze je funkce nesmírn╪ uºiteƒná p²i p²ekladu ob╪ma sm╪ry. P²i opaƒném sm╪ru p²ekladu pak máme k dispozici terminologii pàvodn╪ pocházející z v∞chozího jazyka, a lze tedy p²edpokládat, ºe by m╪la b∞t správná.
AutoText - podobn╪ jako v MS Office je k dispozici funkce umoºσující náhradu zkratky rozvinut∞m tvarem. Zde je vτak sada zkratek vázána na jeden jazyk, takºe nemàºe docházet ke kolizím, které n╪kdy známe z Wordu.
Uºivatelské rozhraní
Uºivatelské rozhraní je velmi flexibilní. Svàj oblíben∞ zpàsob práce zde najdou jak ctitelé myτi (tlaƒítek), tak rozbalovacích nabídek ƒi klávesov∞ch zkratek.
P²i zaƒátku práce na projektu nejprve slouƒíme historické v∞chozí a cílové soubory (pokud existují) a zaloºíme p²ekladovou pam╪£. Potom importujeme soubory, které se mají p²ekládat - k dispozici jsou formáty Word, RTF, Help, PowerPoint, FrameMaker, PageMaker, QuarkXpress, Interleaf, Java Properties, HTML, SGML, C/C++, IBM (tm), Trados Workbench.
Po skonƒení práce se hotov∞ p²eklad exportuje zp╪t do pàvodního formátu vƒetn╪ veτker∞ch ²ídicích znakà. K dispozici je jeτt╪ jedna funkce, která vτak pro ƒeτtinu jako cílov∞ jazyk p²íliτ nepomàºe. Jedná se o automatickou kontrolu konzistence p²ekladu - pro poloºky z TD lze zkontrolovat, zda v celém projektu je dané sousloví p²eloºeno shodn╪. Bohuºel pro ƒeτtinu s její bohatostí pádov∞ch koncovek je tato funkce jen ƒásteƒn∞m p²ínosem.
Zcela nezávislou souƒástí, která je vlastn╪ bonusem i pro uºivatele jin∞ch editorà, je program TermWatch, kter∞ umoºσuje pouºívat terminologické databáze i p²i práci v jiném programu - zkouτen byl Word a Excel. Dlouhou databázi (skoro 4 MB) k mému p²ekvapení TermWatch prohledával dosti rychle.
Podporované jazyky
Jako v∞chozí i cílové jazyky podporuje DéjΩ Vu celkem p²es 130 jazykà, vƒetn╪ takov∞ch exotà, jako je urdτtina, tatarτtina nebo maorτtina. P²ísluτná písma závisí na operaƒním systému. Jak produkt podporuje jazyky s netypick∞m sm╪rem zápisu (zprava doleva, seshora dolà), jsem vzhledem k "st²edoevropskému" operaƒnímu systému vyzkouτet nemohl. P²i instalaci lze vybrat kontrolu pravopisu pro jeden z osmi jazykà; ƒeτtina, bohuºel, mezi nimi zatím není.
Záv╪r
DéjΩ Vu lze rozhodn╪ doporuƒit p²ekladatelàm textà, kde se vyskytují opakující se sekvence nebo kde záleºí na homogenit╪ p²ekladu, nap². p²i lokalizacích dokumentace veτker∞ch v∞robkà. Pom╪rn╪ vysoká po²izovací cena (na webu je uvád╪no 990 EUR za jednu licenci, coº v dob╪ psaní ƒlánku p²edstavovalo více neº 36 000 Kƒ) se vτak p²ekladateli nebo skupin╪ p²ekladatelà vrátí jen p²i intenzivním vyuºívání. Není to vτak chyba v∞robce; uvedená cena je u produktà této kategorie naprosto obvyklá. P²íƒinou je spíτe nedostateƒné ocen╪ní práce odborn∞ch p²ekladatelà, které u nás p²edstavuje zlomek evropské úrovn╪.
Dàleºitou vlastností produktu je moºnost osahat si skuteƒn╪ pln╪ funkƒní produkt. Na adrese www.atril.com je moºné si produkt stáhnout. Po jeho nainstalování se vypíτe klíƒ produktu, kter∞ zaτleme firm╪, a zcela zdarma dostaneme registraƒní klíƒ, kter∞ zajiτ£uje na jeden m╪síc plnou registraci - tedy i podporu. U takto komplexních produktà je to jedin∞ zpàsob, jak zjistit, zda práv╪ tento produkt vyhovuje naτí p²ekladatelské leto²e a typu textà, které nejƒast╪ji p²ekládáme. Profesionálnímu p²ekladateli, kterému za m╪síc prochází poƒítaƒem n╪kolik desítek tisíc slov, tato doba na posouzení bohat╪ postaƒuje.