SyntΘza °eΦi v ΦeskΘm jazyce
Text-To-Speech
Diplomovß prßce 1997


Zadanφ:
  1. Seznamte se s problematikou syntΘzy °eΦi a jejφmi zvlßÜtnostmi pro Φesk² jazyk.
  2. Analyzujte postup tvorby °eΦi pomocφ poΦφtaΦov²ch prost°edk∙ a zhodno¥te mo₧nΘ varianty podle pam∞¥ovΘ a v²poΦetnφ nßroΦnosti.
  3. Seznamte se s programovacφmi prost°edky jazyka C.
  4. Navrhn∞te modul pro syntΘzu v ΦeskΘm jazyce a jeho programovΘ rozhranφ s ohledem na p°enositelnost na ·rovni zdrojov²ch text∙.
  5. Implementujte zßkladnφ vlastnosti navr₧enΘho modulu v prost°edφ MS-Windows.



Popis:

Cφlem tΘto diplomovΘ prßce bylo navrhnout modul pro syntΘzu °eΦi váΦeskΘm jazyce a jeho programovΘ rozhranφ sáohledem na p°enositelnost na ·rovni zdrojov²ch text∙. Tento modul pak implementovat váukßzkovΘ aplikaci váprost°edφ MS-Windows.

V²sledn² systΘm se sklßdß ze Φty° Φßstφ a to ze t°φ knihoven (fonetickß transkripce ΦeÜtiny, syntΘzy °eΦi, ovladaΦe zvukovΘ karty) a zast°eÜujφcφ ukßzkovΘ aplikace. Viz blokovΘ schΘma.

Nejprve, p°ed samotnou syntΘzou, je t°eba upravit vstupnφ text podle pravidel fonetickΘ transkripce ΦeÜtiny, co₧ je jednoznaΦn² zßpis zvuk∙ mluvenΘ ΦeÜtiny. D∙le₧itΘ je, ₧e pravidla jsou jazykov∞ zßvislß, to znamenß, ₧e nap°φklad pravidla pro fonetickou transkripci angliΦtiny nenφ mo₧nΘ sá·sp∞chem pou₧φt na zpracovßnφ ΦeskΘho textu. Ve svΘ prßci pou₧φvßm vφce ne₧ 50 pravidel. V tΘto Φßsti rovn∞₧ vklßdßm prozodickΘ znaΦky. KonkrΘtn∞ slovnφ p°φzvuk a slovnφ rßz.

SyntΘzu °eΦi provßdφm váΦasovΘ oblasti. Tato metoda je relativn∞ v²poΦtov∞ nenßroΦnß. Pam∞¥ovß nßroΦnost je zßvislß na mno₧stvφ a kvalit∞ dat. Jako stavebnφ jednotku pou₧φvßm alof≤n, kter² p°estavuje fonΘm vár∙zn²ch poziΦnφch variantßch dan²ch lev²m i prav²m kontextem, ve kter²ch se fonΘm nachßzφ. M∙j syntezßtor mß kádispozici akustickΘ znalosti o velikosti 300 8-bitov²ch vzork∙ alof≤n∙ o frekvenci vzorkovßnφ 11 kHz. Toto mno₧stvφ je srovnatelnΘ sájin²mi komerΦnφmi syntezßtory a je dßno kvantitativnφm v²zkumem souΦasnΘ mluvenΘ ΦeÜtiny. Program a formßt dat je navrhnut tak, aby bylo mo₧nΘ sákvalitou a kvantitou akustick²ch znalostφ libovoln∞ manipulovat. Pam∞¥ovou nßroΦnost lze ovlivnit volbou re₧imu Φinnosti knihovny syntezi °eΦi (Minimßlnφ/Maximßlnφ).

Co se t²Φe p°enositelnosti na ·rovni zdrojov²ch text∙, je modul fonetickΘ transkripce a modul syntΘzy napsßn vájazyce ANSI-C. ImplementaΦn∞ zßvisl² je jen ovladaΦ zvukovΘ karty. OvladaΦ zvukovΘ karty jsem vytvo°il jak pro prost°edφ DOSu pro kartu Sound Blaster, tak pro prost°edφ MS Windows. Jako problΘm se ukßzala existence r∙zn²ch druh∙ k≤dovßnφ ΦeÜtiny. Proto datovΘ soubory a ΦßsteΦn∞ i hlaviΦkovΘ soubory musφ existovat ve vφce variantßch dle k≤dovßnφ ΦeÜtiny.

Na zßv∞r je nutnΘ poznamenat, ₧e i kdy₧ je vásouΦasnΘ dob∞ vytvo°eno mnoho °eΦov²ch syntezßtor∙, p°esto nejobtφ₧n∞jÜφ ·loha vátΘto oblasti, tj. konverze textu na °eΦ, zatφm zcela uspokojiv∞ vy°eÜena nebyla. P°ed odbornφky stojφ toti₧ zatφm Φasto opomφjen² krok, kter² p°edstavuje vΦlen∞nφ v²sledk∙ sΘmantickΘ anal²zy a jazykovΘho rozboru zpracovßvanΘho textu do °φzenφ prozodick²ch p°φznak∙ °eΦi. Proto lze jen souhlasit sátvrzenφm Jana Zimmermana, ₧e dokud nebude jazykov² rozbor p°irozenΘho jazyka souΦßstφ syntezßtor∙, budou vÜechny um∞lΘ hlasy pouh²m souborem faleÜn∞ kvßkajφcφch robot∙.

Ing. Radim Bßrta



Ukßzky (WAV):

Program


Literatura:
  1. B┴RTA R.: SyntΘza °eΦi v ΦeskΘm jazyce. Diplomovß prßce, VèB-TU Ostrava 1997. 70s.
  2. PSUTKA J.: Komunikace s poΦφtaΦem mluvenou °eΦφ. Academia, Praha 1995, 287s.
  3. Sbornφk p°ednßÜek: Anal²za, syntΘza a rozpoznßvßnφ °eΦi. ╚SVTS, Praha 1985, 156s.
  4. MA╪═K V., èT╠P┴NKOV┴ O., LAÄANSK▌ J. a kol.: Um∞lß inteligence. Dφl 1. Academia, Praha 1993, 264s.
  5. LAZZARO J. J.: Mluvit stejn∞ jako my. Bajt, 1992, Φ.4, s.97-101.
  6. ZIMMERMAN J.: ╪eΦ pot°ebuje trochu citu. Bajt, 1992, Φ.4, s.98-99.
  7. UHL═╪ J., V═CH R.: ╚φslicovß anal²za a syntΘza °eΦi. Prognostickß studie. ╚SAV, Praha 1985, 36s.
  8. Kolektiv autor∙: ObΦanΘ se zdravotnφm posti₧enφm a informaΦnφ technologie. In: TΘma t²dne ComputerWorld, 1996, Φ. 10, s.21-28.
  9. EFA: Jak zßbavnΘ, uΦit stroje mluvit... ComputerWorld, 1997, Φ. 16, s.46.
  10. Internet: CS-VOICE. WWW strßnka firmy FROG Systems s.r.o. http://www.anet.cz/frog
  11. Internet: FONETIC. WWW strßnka Jakuba Dadßka (Cortex Software). http://ww2.fce.vutbr.cz/~smdad
  12. PETR J. a kol.: Mluvnice ΦeÜtiny. Dφl 1. Academia, Praha 1986, 566s.
  13. ROMPORTL M.: Zßklady fonetiky. UΦebnφ texty. FF UK, Praha 1973, 162s.
  14. FILIPEC J. a kol.: Sbornφk spisovnΘ ΦeÜtiny. Academia, Praha 1994, 647s.
  15. T╠èITELOV┴ M. a kol.: Kvantitativnφ charakteristiky souΦasnΘ ΦeÜtiny. Academia, Praha 1985, 249s.

hlavnφ strßnkapoÜta
hlavnφ strßnkapoÜta