PoΦφtaΦi, p°eΦti mi pohßdku

OzvuΦenφ text∙ a rozeznßnφ hlasu

Stßle Φast∞ji se zaΦφnajφ objevovat voln∞ Üφ°enΘ utility pro rozeznßvßnφ a syntΘzu °eΦi dotahujφcφ dostupnΘ komerΦnφmi produkty. Je bohu₧el fakt, ₧e tato hlasovß °eÜenφ jsou v∞tÜinou nadstavby pro rozhodn∞ ne dokonalΘ °eΦovΘ enginy a na profesionßlnφ systΘmy, kterΘ se domßcφm u₧ivatel∙m pod ruku nedostanou, jednoduÜe nemajφ.

Obsah :
Web Talkster 3.9s
Web Talkster doslova p°e₧v²kß obsah celΘ strßnky.
CyberBuddy 2.12
S CyberBuddy vßm agent prozradφ i aktußlnφ poΦasφ.

Speakonia 1.03
S Φesk²m TTS enginem se Speakonia pokusφ Φφst i text v naÜφ mate°Ütin∞.

GUI Reader 2.0
Ani ruÜtφ v²vojß°i nezapomφnajφ na hlasovΘ programovΘ vybavenφ. 800 KB ve srovnßnφ se 4 MB - to je z°ejmß p°ednost.

Voice Navigator 1.01
S jednoduch²m ovlßdßnφm Voice Navigatoru nebudete mφt problΘmy.

Mush
Zpφvajφcφ s≤lista.

Bez ohledu na to, ₧e doposud nedoÜlo ke kvalitativnφmu pr∙lomu v takovΘ zajφmavΘ a perspektivnφ oblasti jakou je syntΘza °eΦi Φi rozpoznßvßnφ hlasu a hlasovΘ °φzenφ, novΘ utility pro stßvajφcφ technologie se objevujφ se zßvid∞nφhodnou pravidelnostφ. Mezi nimi je mo₧nΘ narazit na produkty nejr∙zn∞jÜφho p∙vodu, bohu₧el Φesk²ch program∙ zatφm mnoho nenφ. V p°ehledu, kter² je pro vßs p°ipraven, jsme si nevytyΦili ·kol ukßzat jednoho vφt∞ze - vÜichni ·Φastnφci jsou urΦeni pro °eÜenφ r∙zn²ch ·kol∙, tudφ₧ pracujφ r∙zn∞.

Ka₧dß z t∞chto utilit mß urΦitΘ nedostatky a °eÜit jakΘkoli zßva₧nΘ ·koly pomocφ hlasovΘho °φzenφ je nemo₧nΘ. Ale ty funkce, kterΘ jsou k dispozici, jasn∞ hovo°φ o tom, jak²m sm∞rem p∙jdou v²vojß°i metod hlasovΘho °φzenφ poΦφtaΦe. Myslφm si, ₧e mo₧nost velet svΘmu PC z pohodlnΘho k°esla nikdo neodmφtne.

U₧iteΦnΘ odkazy
Jestli₧e n∞kter² z uveden²ch program∙ nebude fungovat - stßhn∞te a nainstalujte si komplet hlasov²ch knihoven Microsoft. VÜechny pot°ebnΘ soubory naleznete na Chip CD:

Pokud ₧ßdn² zvuk neuslyÜφte, p°einstalujte SAPI: spchapi.exe (824KB)
Engine pro rozpoznßnφ °eΦi: actcnc.exe (6 MB)
Control panel p
°idß ikonu do Nastavenφ: spchcpl.exe (927 KB, ne pro XP)

Podpora °eΦi:

angliΦtina: lhttseng.exe (2,6MB)
n∞mΦina: lhttsged.exe (2,2MB)
ΦeÜtina: GB_TTS_Install.exe (896KB), http://www.gb-soft.cz

Co se t²Φe program∙ t°etφch stran, pro n∞ je nutnß zvlßÜtnφ podpora:

msagent.exe  (400 KB, v 2K/XP/Me ji₧ obsa₧eno)
Φeskß podpora pro dialogy (ne °eΦ): AgtX0405.exe (128 KB).

ZvlßÜt∞ zmφnφme TTS engine (Text To Speech) s podporou ΦeskΘho jazyka od firmy GB-SOFT (GB_TTS_Install.exe (896KB), http://www.gb-soft.cz). Po jeho instalaci mßte mo₧nost v∞tÜinu nßsledujφcφch program∙ nauΦit mluvit Φesky.

Web Talkster 3.9s

Instalace/Kopφrovßnφ

+ p°idßvß hlasovΘ funkce do Internet Exploreru
+ pou₧φvß animovanΘ postavy
- nelze p°esn∞ nastavit parametry Φtenφ
- vy₧aduje mnoho operaΦnφ pam∞ti

Snad ₧ßdn² program pracujφcφ ve Windows nemß tolik variacφ a nßslednφk∙ jako MS Internet Explorer. T∞₧ko °φci, co je d∙vodem tohoto stavu û p°es mnohΘ nedostatky samotnΘho prohlφ₧eΦe se m∙₧e t∞Üit ohromnΘ popularit∞ mezi u₧ivateli. Faktem z∙stßvß, ₧e se snad ka₧d² m∞sφc objevuje n∞jakß jeho dalÜφ varianta.

Podle mΘho nßzoru by bylo p°ekvapivΘ, kdyby v²vojß°i hlasov²ch program∙ z∙stali stranou od vÜeobecnΘho nadÜenφ programujφcφ mlßde₧e a nevytvo°ili by äΦtecφ zßzrakô ala Internet Explorer. P°φkladem m∙₧e b²t Web Talkster û bezplatn² prohlφ₧eΦ s podporou technologiφ text-to-speech a MS Agent.

Prohlφ₧eΦ je samoz°ejm∞ vybudovßn na zßkladu Internet Exploreru, ale p°itom zabφrß 1,5krßt v∞tÜφ objem operaΦnφ pam∞ti, ne₧ microsoftφ prap°edek. Okno tohoto prohlφ₧eΦe, bez ohledu na velkß tlaΦφtka a mo₧nost zm∞ny barev, neomyln∞ takΘ Explorer p°ipomφnß. Je pravda, ₧e °ada d∙le₧it²ch funkcφ (kopφrovßnφ, tisk, hledßnφ na strßnce atd.) je schovßna v menu Options - File, ale vÜechno ostatnφ je ud∞lanΘ jako v originßlu, plus t°i novß tlaΦφtka: Speak (Φtenφ veÜkerΘho textu na celΘ webovΘ strßnce), Selected (Φtenφ pouze oznaΦen²ch odstavc∙) a QuitSpk (zruÜenφ ozvuΦenφ).

Web Talkster pou₧φvß sympatickΘ animovanΘ postaviΦky - pomocnφky. Podpora tΘto technologie spoleΦn∞ s podobou Φarod∞je Merlina se nastavuje b∞hem procesu instalace prohlφ₧eΦe. Mimochodem knihovny MS Speech API a anglickß varianta °eΦovΘho enginu Lernout & Hauspie budou takΘ nabφdnuty.

Vlastnφ hlas, p°esn∞ji °eΦeno jeho zabarvenφ a rychlost Φtenφ, je mo₧nΘ nastavit v menu Options - Speech. Bohu₧el nastavenφ je mo₧nΘ pouze p°ibli₧nΘ. Proto na ·rovni rychlosti Medium bude prohlφ₧eΦ Web Talkster Φφst texty p°φliÜ rychle, ve variant∞ Slow p°esp°φliÜ pomalu.

Pomocφ menu Options - Character Options m∙₧ete takΘ optimalizovat svΘho pomocnφka, vybrat jeho podobu (Select character) nebo ho ·pln∞ vypnout (Move - Off screen). Je zajφmavΘ, ₧e i bez zobrazenφ pomocnφka bude Web Talkster pokraΦovat ve Φtenφ strßnek.

Z dopl≥kov²ch mo₧nostφ mluvφcφho prohlφ₧eΦe bych cht∞l upozornit na vestav∞nou funkci hledßnφ na Google.com (jako v prohlφ₧eΦi Opera) a takΘ maliΦk² zßpisnφΦek pro poznßmky - My Surf'n Notes.

Zpφvajφcφ s≤lista (http://www.pepedog.com)
Nevφm, jestli je to Üpatn∞ nebo dob°e, ale programy, zalo₧enΘ na technologii MS Agent se vytvß°ejφ hlavn∞ pro zßbavu d∞tφ nejr∙zn∞jÜφho v∞ku. Samoz°ejm∞, ₧e jednotlivφ v²vojß°i se sna₧φ p°idat sv²m program∙m alespo≥ Üpetku respektu a zßva₧nosti, ale dφky tomu jsou Φasto jejich v²tvory o to komiΦt∞jÜφ. Jinφ se naopak v∙bec nesna₧φ skr²vat zßbavn² charakter sv²ch v²tvor∙, jako nap°φklad tv∙rce utility MUSH.

Mush.zip (132 KB)

MUSH je zkratka z Music Scripting Helper. Tato utilita vytvß°φ skripty pro hudebnφ MIDI a KAR (text Karaoke) soubory. Pou₧φvat MUSH nenφ slo₧itΘ. Je zapot°ebφ pouze vybrat agenta (nejlΘpe shodnΘho se zßkladnφm), oznaΦit vÜechny body krom∞ La┤ the words, rozhodnout, kam ulo₧it hotov² klip, klepnout na Convert a najφt vhodn² soubor MIDI nebo KAR (Karaoke û hudebnφ MIDI s textem) pro zpracovßnφ. Hodφ se libovolnß skladba, ale pouze s anglick²mi slovy - ΦeskΘ texty MUSH nepodporuje. Mimochodem, kdy₧ se klikne na tlaΦφtko Find same Karaoke Files, v prohlφ₧eΦi se otev°e strßnka mno₧stvφm KAR soubor∙.

Pokud se rozhodnete, kreslenß postaviΦka vßm zazpφvß vybranou pφsniΦku. Samoz°ejm∞, ₧e to nebude takovΘ, jako od Luciana Pavarottiho, ale bude to sv²m zp∙sobem originßlnφ. Pokud vßm interpretace vyhovφ, MUSH ulo₧φ v²sledek. Ze t°ech mo₧n²ch variant jsem si osobn∞ vybral ten nejjednoduÜÜφ a dostupn² - export do Internet Exploreru (Basic web output).

Zφskan² HTML soubor bude obsahovat pouze jedno tlaΦφtko Play. Kdy₧ na toto tlaΦφtko klepnete, objevφ se zpφvajφcφ pomocnφk.

 

CyberBuddy 2.12

Instalace/Kopφrovßnφ

+ mnohofunkΦnost
+ vestav∞n² poÜtovnφ klient a organizΘr
+ pru₧n² systΘm nastavenφ

M∙j oblφben² Agent Reader (www.aldoatools.com) se v tomto roce stal sharewarem, bez boje odevzdal vedoucφ pozici v t°φd∞ neplacen²ch hlasov²ch program∙ virtußlnφmu sekretß°i Johna DeFino CyberBuddy. A prßvem. Tato utilita byla v poslednφch verzφch podstatn∞ p°epracovßna. Za prvΘ se v jejφch nastavenφch objevila mo₧nost v²b∞ru klφΦov²ch frßzφ pro r∙znΘ jazyky, ΦeÜtina ale chybφ (General - Advanced Options - Select Language Files) a za druhΘ byla opravena nep°φjemnß chyba spojenß s chyb∞jφcφm korektnφm ukonΦenφm (bez stlaΦenφ Ctrl+Alt+Del) programu po skonΦenφ prßce.

Nynφ, potom co se zbavil h°φÜk∙ mlßdφ, nabφzφ CyberBuddy v²konn² univerzßlnφ program, kter² plnφ mno₧stvφ u₧iteΦn²ch funkcφ pro Üirok² okruh u₧ivatel∙: mluvφcφho poÜ¥ßka (E-mail), organizΘr (Remind), internet pager (Buddies - Send), zprost°edkovatele p°φsp∞vk∙ (News), takΘ hlφdaΦe zm∞n na webov²ch strßnkßch (WWW) a pohybu kurz∙ na burzßch (Stocks). VÜe je ozvuΦeno, ozdobeno animovan²mi postaviΦkami a navφc zcela zadarmo. Zcela jist∞ to mß smysl vyzkouÜet, pouze hlasov² engine a knihovny se musφ stßhnout odd∞len∞, neb nejsou souΦßstφ distribuΦnφ verze CyberBuddy.

V tomto programu je mo₧nΘ vÜe nastavit podle vlastnφho vkusu. Na zßlo₧ce General - Character and Speech Options si nastavte podle sebe r∙znΘ parametry pomocnφk∙ a hlasov²ch engin∙. Na zßlo₧ce General - Advanced Options vyberte skin pro zßkladnφ okno programu a napiÜte, pokud chcete, vlastnφ frßze pro animovanΘ postaviΦky (Custom Message).

Na zßlo₧ce E-mail budete muset zadat adresu svΘ poÜtovnφ schrßnky a takΘ u₧ivatelskΘ jmΘno a heslo pro p°φstup k e-mailu. Nynφ, po p°φkazu Get E-mail Now, budete dostßvat poÜtu a po vyznaΦenφ p°φsluÜnΘho dopisu uslyÜφte jeho obsah (Read E-mail).

Pokud program instalujete z CD, je t°eba jako prvnφ spustit soubor ätv_enua.exeô pro instalaci hlasovΘho enginu. Jinak se program bude tento soubor sna₧it nahrßt z internetu.

DalÜφ odkazy:

CS-VOICE 97
- Φesk² hlasov² v²stup
cena cca 5000 KΦ, http://www.frog.cz

Ukßzka profesionßlnφch projekt∙ - webovΘ generovßnφ °eΦi (Φte zadan² text)
http://www.speechtech.cz
http://www.bell-labs.com/project/tts/voices.html
http://www.research.att.com/projects/tts


Speakonia 1.03

Instalace/Kopφrovßnφ

+ jednoduchΘ rozhranφ
+ mo₧nost ulo₧enφ ΦtenΘho textu do WAV souboru
- nastavenφ je mo₧nΘ pouze pro engine Lermout & Hauspie

NejjednoduÜÜφ a dostupn² zp∙sob jak ozvuΦit text v poΦφtaΦi je pou₧φt program Speakonia. JedinΘ, co budete pot°ebovat je nainstalovat vybran² hlasov² engine (Lermout & Hauspie, Digalo nebo Sakrament). Co se t²Φe knihoven MS Speech API a podpory anglickΘho jazyka (American English), ty jsou ji₧ v²robcem p°ilo₧eny v instalaΦnφm souboru.

Rozhranφ Speakonia - to je vzor minimalizmu. Nic zbyteΦnΘho, pouze zßkladnφ hlasovΘ funkce. Ovlßdßnφ je ·pln∞ stejnΘ jako v multimedißlnφch p°ehrßvaΦφch: tlaΦφtko spuÜt∞nφ Φtenφ, pauzy a ·plnΘho zastavenφ. Parametry p°ednßÜenφ se v zßsad∞ dajφ nastavovat (Speech - Properties). M∙₧ete si vybrat hlasov² engine, rychlost, zabarvenφ a zvuΦnost hlasu - nutno p°iznat ₧e pouze pro engine Lernout & Hauspie. Ale v ka₧dΘm p°φpad∞ hodnoty, kterΘ jsou nastaveny implicitn∞, vßm urΦit∞ budou vyhovovat. Pokud se zamotßte v nastavenφch, m∙₧ete klidn∞ kliknout na tlaΦφtko Reset a nespletete se. Tφm spφÜe, ₧e kvalita Φtenφ nezßvisφ na vlastnφm programu Speakonia. V Editoru u₧ivatelsk²ch slovnφk∙, kter² se objevφ po kliknutφ myÜi na tlaΦφtko Lexicon na zßlo₧ce Opravy je mo₧nΘ up°esnit nesprßvn∞ ozvuΦenß slova nebo zkratky.

Mimochodem nenφ to a₧ tak nutnΘ, proto₧e Speakonia vcelku dob°e ozvuΦuje text ze schrßnky, textovΘ soubory, strßnky na internetu (File - Read Webpage) a takΘ aktußlnφ Φas a datum. Po registraci na internetov²ch strßnkßch programu (Tools - Options - Registration) se objevφ mo₧nost ulo₧enφ strojovΘho Φtenφ do WAV souboru (File - Save as Wav File).


GUI Reader 2.0

Instalace/Kopφrovßnφ

+ nenßroΦnost na zdroje
+ mo₧nost v²b∞ru jazyka textu
- mß pouze vÜeobecnß systΘmovß nastavenφ

Ani ruÜtφ v²vojß°i nezapomφnajφ na hlasovΘ programovΘ vybavenφ. P°φkladem m∙₧e b²t GUI Reader Andreje Jefimova, kter² podporuje vÜechny pot°ebnΘ funkce pro programy obdobnΘho druhu, ale p°itom zabφrß p∞tkrßt (!) mΘn∞ operaΦnφ pam∞ti, ne₧ Web Talkster a CyberBuddy: 800 KB ve srovnßnφ se 4 MB - to je z°ejmß p°ednost.

V klidovΘm stavu je GUI Reader zastoupen ikonkou v pravΘ Φßsti hlavnφho panelu a nijak nep°ekß₧φ u₧ivateli p°i prßci. Pro jeho aktivaci je nutnΘ kliknout prav²m tlaΦφtkem myÜi na tuto ikonku a vybrat v rozbalovacφm menu to, co je zapot°ebφ. Je mo₧nΘ po₧ßdat GUI Reader, aby ozvuΦit textov² soubor (Read File) nebo obsah schrßnky (Read Clipboard).

Bohu₧el program neobsahuje prakticky ₧ßdnß nastavenφ. K dispozici jsou pouze standardnφ systΘmovß menu vlastnosti a dopl≥kovΘ parametry. Pouze tak je zde mo₧nΘ nastavit pomocnφka a jeho hlas. Zato v GUI Reader je povoleno vybφrat jazyk ozvuΦenΘho textu, bohu₧el hlavnφ je, aby ve vaÜem systΘmu byl nainstalovßn p°φsluÜn² hlasov² engine s podporou vßmi po₧adovanΘho jazyka.

V instalaΦnφm balφku chybφ pouze hlasovΘ enginy, kterΘ je nutnΘ instalovat zvlßÜ¥.

 

Voice Navigator 1.01

Instalace/Kopφrovßnφ

+ vysokß p°esnost rozeznßvßnφ
+ mo₧no zadat hlasovou odpov∞∩ poΦφtaΦe
- po₧aduje opakovanΘ uΦenφ p°φkaz∙

Voice Navigator - to je jedin² komerΦnφ program v tomto p°ehledu a jedinß utilita, kterß je urΦena pro hlasovΘ °φzenφ poΦφtaΦe. Jako zajφmavost lze uvΘst, ₧e Navigßtor vytvo°ilo petrohradskΘ Centrum °eΦov²ch technologiφ, to samΘ, kterΘ se zab²valo rozÜifrovßnφm nahrßvek ponorky Kursk, kterß se p°ed dv∞ma lety potopila v Barentsov∞ mo°i.

Oblφben²m dφtkem tohoto centra je Truffaldino, komplex hlasovΘho °φzenφ domßcφ a kancelß°skΘ techniky. V²vojß°i slibujφ, ₧e v n∞m bude obsa₧ena ·plnß podpora televizφ, telefon∙ a dokonce mikrovlnn²ch trub. Je pravda, ₧e jak to vypadß v praxi, je mo₧nΘ se pouze dohadovat - demoverze Truffaldina nic takovΘho nedemonstruje.

Ale demoverze Voice Navigßtoru se ukßzala z tΘ nejlepÜφ strany. Sice ne ihned, ale a₧ po menÜφm trΘninku.

Pro procviΦovßnφ je nutnΘ vyznaΦit myÜφ jeden z p∞ti bod∙, kterΘ jsou p°φstupnΘ v demoverzi, kliknout myÜφ na tlaΦφtko Improve Recognition a z°eteln∞ vyslovit p°φsluÜn² povel. M∙₧e to b²t libovolnΘ slovo a dokonce i zvuk. Nap°φklad jß si spouÜtφm KalkulaΦku na zapφsknutφ.

Ihned po uΦenφ vyzkouÜejte vyslovit do mikrofonu p°φkaz pro spuÜt∞nφ n∞jakΘho programu, nap°. PoznßmkovΘho bloku a ov∞°te reakci. Kdy₧ skonΦφte prßci, vyslovte podmφn∞n² p°φkaz pro Zav°φt a aktivnφ okno se zav°e. P°φkazy se provßdφ pom∞rn∞ rychle a p°esn∞, ale Φas od Φasu je zapot°ebφ je opakovan∞ uΦit.

Krom∞ vÜeho ostatnφho je pro p°φkazy u₧ivatele mo₧nΘ zadat urΦitou hlasovou odpov∞∩ v tzv. Sound File Manager. Pokud vßm nevyhovuje implicitnφ varianta, klikn∞te na Replace a ulo₧te nebo nadiktujte svoje vlastnφ.

A. Jevdokimov, P. Zßkosteln²