Automatick² p°ekladaΦ
na stranßch i4U
Vadφ vßm, ₧e na sv²ch nejzajφmav∞jÜφch stranßch mluvφ s vßmi zatφm Internet po°ßd jeÜt∞ jenom anglicky?
Mysleli jsme na vßs. A₧ p°φÜt∞ najdete dalÜφ nesmφrn∞ zajφmav² text, jemu₧ nerozumφte, pak po p°eΦtenφ tohoto Φlßnku budete znßt °eÜenφ. Jmenuje se EuroTran96 a na Internetu jej od ledna najdete na naÜφ strßnce www.idg.cz/i4U .
Vlastn∞ jen Φirou nßhodou, kdy₧ jsme pßtrali po dneÜnφm p∙sobiÜti autora n∞kdejÜφho velmi ·sp∞ÜnΘho ΦeskΘho programu Winton Milanu èustkovi, doΦkali jsme se p°ekvapenφ v podob∞ Eurotranu. Jde o obchodnφ znaΦkou chrßn∞n² programov² modul novΘho anglicko-ΦeskΘho strojovΘho p°ekladaΦe, kter² je schopen p°elo₧it b∞₧n² anglick² text do relativn∞ srozumitelnΘ podoby v ΦeÜtin∞. P°i p°ekladu transformuje syntaktickou strukturu v∞ty, sßm sklo≥uje a Φasuje ΦeskΘ tvary a u vφceznaΦn²ch slov se dokß₧e rozhodova t mezi n∞kolika mo₧n²mi p°eklady na zßklad∞ kontextu, ve kterΘm se danΘ slovo vyskytlo.
Modul je ve form∞ knihovny pou₧itelnΘ v jakΘkoliv windowsovΘ aplikaci a pro jeho eventußlnφ pou₧itφ v oblasti Internetu se nabφzejφ dv∞ zßkladnφ mo₧nosti:
P°ekladov² server.
Program b∞₧φ na internetovΘm serveru na bßzi Windows NT a je p°φstupn² pomocφ standardnφch webov²ch prohlφ₧eΦ∙. U₧ivatel do urΦenΘho pole zapφÜe nebo myÜφ p°enese anglick² text, stiskne tlaΦφtko a poΦφtaΦ zobrazφ o okno nφ₧ rovnou text p°elo₧en² do ΦeÜtiny.
U₧ivatel t°eba pracuje b∞₧n²m zp∙sobem se strßnkou v angliΦtin∞. Anglicky vÜak umφ pouze ΦßsteΦn∞ a °ad∞ slov nerozumφ. Vyu₧ije tedy mo₧nosti strojovΘho p°ekladu a po stisku p°φsluÜnΘho tlaΦφtka se mu anglickß strßnka objevφ ve stejnΘm grafickΘm rozlo₧enφ, ale u₧ s Φesk²m textem. Jin² u₧ivatel, kter² neumφ anglicky v∙bec, m∙₧e zapnout on-line p°eklad nastßlo a pr∙b∞₧n∞ zobrazovanΘ strany Internetu se mu tak v dolnφ Φφsti obrazovky zobrazujφ i Φesky. Eurotran disponuje dostateΦn²m v²konem na to, aby mohl p°itΘkajφcφ data p°eklßdat pr∙b∞₧n∞.
Eurotran vychßzφ p°i p°ekladu z hloubkovΘ anal²zy syntaktickΘ struktury ka₧dΘ v∞ty p°eklßdanΘho textu. V pr∙b∞hu anal²zy je v∞ta rozd∞lena na jednotlivΘ v∞tnΘ Φleny, kterΘ jsou pak p°eklßdßny specifick²m souborem gramatick²ch pravidel. My zde pro ilustraci uvßdφme jen v²Φet n∞kter²ch gramatick²ch jev∙, kterΘ Eurotran dokß₧e zpracovat:
RozliÜφ Φφslo podstatn²ch jmen:
house p°elo₧φ jako d∙m
houses p°elo₧φ jako domy
Podstatnß jmΘna vysklo≥uje podle ΦeskΘ p°edlo₧ky:
in the book v knize
on the table na stole
P°φvlastky podle pßdu k nim pat°φcφch podstatn²ch jmen:
an interesting new book zajφmavß novß kniha
in her own records v jejφch vlastnφch zßznamech
Stup≥ovßnφ p°φdavn²ch jmen:
larger v∞tÜφ
the most interesting nejzajφmav∞jÜφ
╚asovßnφ sloves:
he works on pracuje
we will be working my budeme pracovat
Vybere odpovφdajφcφ vazbu u p°edm∞tu:
I read a book jß Φtu knihu
I gave him a new book jß jsem dal jemu novou knihu
Program takΘ dokß₧e rozpoznat vÜechny slovesnΘ Φasy, podmi≥ovacφ zp∙sob, zkrßcenΘ podoby slovesn²ch tvar∙ (we\ll, don\t,...), dokß₧e sprßvn∞ sklo≥ovat podstatnß jmΘna po Φφslovkßch a podobn∞. Verze, ji₧ jsme obdr₧eli k prvnφmu posouzenφ, vykazuje zatφm jeÜt∞ (v∞dom∞) n∞kterΘ nedostatky, nap°. v rozkazovacφm zp∙sobu, ten vÜak je v b∞₧n²ch textech mimo literßrnφ ·tvary v∞tÜinou mΘn∞ frekventovan² a navφc v p°φÜtφ verzi u₧ mß b²t vy°eÜen i ten. JeÜt∞ do konce roku bude probφhat dopl≥ovßnφ, jak gramatic k²ch pravidel, tak slovnφku, u n∞j₧ je jeÜt∞ provßd∞na zßv∞reΦnß revize.
Co Eurotran odliÜuje od vÜech zatφmnφch program∙ tohoto typu, je okolnost, ₧e se umφ na zßklad∞ kontextu ve v∞t∞ rozhodnout mezi n∞kolika mo₧n²mi p°eklady tΘho₧, do ΦeÜtiny vφce zp∙soby p°evoditelnΘho slova. Tak nap°φklad totΘ₧ anglickΘ slovo "stand" p°elo₧φ jinak, je-li u n∞j v originßle Φlen "the stand" = postoj anebo, pokud je u n∞j zßjmeno osobnφ, pochopφ, ₧e tentokrßt nenφ totΘ₧ slovo podstatn²m jmΘnem, ale slovesem: I stand = jß stojφm
Podobn∞ jsme vyzkouÜeli:
the rock skßla
we rock houpeme se
we run (my) b∞₧φme
we run a hotel (my) provozujeme hotel
I try (jß) sna₧φm se
I try to succeed (jß) pokouÜφm se usp∞t
Ve ve slo₧it∞jÜφch p°φpadech p°eklßdß dokonce i podle typu p°edm∞tu:
he doesn\t say that (on) ne°φkß to
he doesn\t say that he agrees (on) ne°φkß, ₧e on souhlasφ
nebo podle p°edlo₧kovΘ vazby:
she looked at the picture dφvala se na obraz
she looked for the picture (ona) hledala obraz
SympatickΘ je i respektovßnφ frekventovan²ch slovnφch spojenφ, je₧ umo₧nφ, ₧e program totΘ₧ slovo p°elo₧φ poka₧dΘ jinak, ale p°esn∞ tak, jak je t°eba:
air condition klimatizace
air raid nßlet
anebo podle funkce ve v∞tnΘm Φlenu:
only my son jen m∙j syn
my only son m∙j jedin² syn
V jeÜt∞ slo₧it∞jÜφch p°φpadech a v∞tßch, jejich₧ anal²za vede k v∞tÜφmu mno₧stvφ nejednoznaΦn²ch °eÜenφ, pou₧φvß program krom∞ v²Üe uveden²ch metod takΘ pravd∞podobnostnφ metody vyu₧φvajφcφ informace o frekventovanosti jednotliv²ch slov v anglickΘm a ΦeskΘm textu.
Zatφm pou₧it² slovnφk obsahuje p°ibli₧n∞ 50 tisφc polo₧ek a p°edstavuje p°ibli₧n∞ 95% pokrytφ anglickΘho textu. DalÜφ funkce umo₧≥ujφ propojit p°ekladaΦ s dalÜφmi odborn²mi nebo u₧ivatelsk²mi slovnφky, "natßhnout" do n∞j z Windows standardnφm zp∙sobem celΘ Φlßnky Φi knihy, a zφskat tak p°φmo do textovΘho editoru u₧ Φesk² p°eklad, nebo chcete-li podklad pro p°eklad.
ZnaΦka Microton, zam∞°enß na v²voj prost°edk∙ pro strojov² p°eklad, dodßvß svΘ p°ekladovΘ moduly u₧ tradiΦn∞ dalÜφm zßjemc∙m, kte°φ je pak uplat≥ujφ ve vlastnφch v²robcφch. (Mezi zatφm nej·sp∞Ün∞jÜφ pat°φ nap°φklad PC Translator nebo Wintran.)
Nadstavba webovΘho prohlφ₧eΦe (plug-in).
Pro nßs je nejzajφmav∞jÜφ, ₧e vzhledem k t∞mto kvalitativn∞ zcela nov²m potencißlnφm mo₧nostem Eurotranu i mo₧nosti "naroubovat" jej na internetov² server, jsme se s jeho tv∙rci dohodli na tom, ₧e od NovΘho roku budou prßv∞ naÜe internetovΘ strßnky prvnφmi, na nich₧ bude mo₧nΘ jej pokusn∞ vyzkouÜet. Anglick² text, kter² najdete na Internetu, budete moci na naÜφ strßnce (www.idg.cz/i4U) "prohnat" Eurotranem a b∞hem n∞kolika vte°in tak zφskßte sice provizornφ, ale p°ece jen srozumiteln² a u₧ upravitel n² p°eklad do ΦeÜtiny.
Tzv. beta-verze, na jejφm₧ zßklad∞ jsme se rozhodovali, je p°itom jeÜt∞ ne·plnß: chyb∞ly v nφ vazby se slovy of , by a that, zatφm jeÜt∞ nebyly aktivnφ dopl≥ovateln² u₧ivatelsk² slovnφk a nßpov∞da a z programu se jeÜt∞ nedalo tisknout. I tak u₧ ale bylo z°ejmΘ, ₧e blφ₧φcφ se dalÜφ tisφciletφ je vskutku nedaleko. Takto n∞jak bude vypadat p°ekladatelsk² robot, o n∞m₧ jsme zatφm jen snili. Program by se m∞l zaΦφt prodßvat zaΦßtkem ledna a relativn∞ nφzkß cena kolem 1500 KΦ by m∞la odpovφdat mo₧nostem n aÜeho trhu, na n∞m₧ je podle odhad∙ z roku 1996 a₧ 80% zbyteΦn∞ drahΘho softwaru nelegßln∞ kopφrovßno. Eurotran 96 by m∞l jφt v tomto sm∞ru cenov∞ p°φkladem. Pro nßzornost dali jsme jako vzorek p°ekladu z elektronickΘ poÜty p°elo₧it do ΦeÜtiny kus vlastnφho anglickΘho dopisu posφlanΘho do ciziny:
P°ßtelΘ, Jß jsem konΦit m∙j dopis nynφ. (I am to close my letter now) Jß budu psßt p°φÜt∞ jin² brzy. M∞jte mφrupln² (peaceful) a barvy pln² (colorful) Nov² Rok a nechat mn∞ v∞d∞t vΦas (let me know soon) kolem vaÜich plßn∙ p°ijφt k Praze. Jß jsem jist², ₧e kdyby Mike b²t tady nynφ, on by u₧φval si toho (he would enjoyed it) velmi hodn∞. VÜechno je vzruÜujφcφ tady nynφ. A Jß bych rßd splßcel vßm vaÜe pohostinstvφ. Zde jsou docela nßdhernΘ hotely nynφ v Praze stejn∞ jako v Singapore; a takΘ hostnφ mφst nost (guest room) v naÜem suterΘnovΘm podla₧φ (basement) pro vßs takΘ tak dob°e.
S nejlepÜφmi p°ßnφmi pro p°ichßzejφcφ Nov² Rok
up°φmn∞ VßÜ
Mo₧nß to znφ n∞kter²m sm∞Ün∞. Ale ti, kdo znajφ "v²sledky" zatφmnφch p°ekladov²ch program∙, v∞dφ, ₧e je to obrovsk² pokrok. Ostatn∞, na naÜφ webovΘ adrese se o tom od ledna p°esv∞dΦφte osobn∞. @
ajn
6 0387