Seznamte se s problematikou syntΘzy °eΦi a jejφmi zvlßÜtnostmi pro Φesk² jazyk.
Analyzujte postup tvorby °eΦi pomocφ poΦφtaΦov²ch prost°edk∙ a zhodno¥te mo₧nΘ varianty podle pam∞¥ovΘ a v²poΦetnφ nßroΦnosti.
Seznamte se s programovacφmi prost°edky jazyka C.
Navrhn∞te modul pro syntΘzu v ΦeskΘm jazyce a jeho programovΘ rozhranφ s ohledem na p°enositelnost na ·rovni zdrojov²ch text∙.
Implementujte zßkladnφ vlastnosti navr₧enΘho modulu v prost°edφ MS-Windows.
Popis:
Cφlem tΘto diplomovΘ prßce bylo navrhnout modul pro syntΘzu °eΦi váΦeskΘm jazyce a jeho programovΘ rozhranφ sáohledem na p°enositelnost na ·rovni zdrojov²ch text∙. Tento modul pak implementovat váukßzkovΘ aplikaci váprost°edφ MS-Windows.
V²sledn² systΘm se sklßdß ze Φty° Φßstφ a to ze t°φ knihoven (fonetickß transkripce ΦeÜtiny, syntΘzy °eΦi, ovladaΦe zvukovΘ karty) a zast°eÜujφcφ ukßzkovΘ aplikace.
Viz blokovΘ schΘma.
Nejprve, p°ed samotnou syntΘzou, je t°eba upravit vstupnφ text podle pravidel fonetickΘ transkripce ΦeÜtiny, co₧ je jednoznaΦn² zßpis zvuk∙ mluvenΘ ΦeÜtiny. D∙le₧itΘ je, ₧e pravidla jsou jazykov∞ zßvislß, to znamenß, ₧e nap°φklad pravidla pro fonetickou transkripci angliΦtiny nenφ mo₧nΘ sá·sp∞chem pou₧φt na zpracovßnφ ΦeskΘho textu. Ve svΘ prßci pou₧φvßm vφce ne₧ 50 pravidel. V tΘto Φßsti rovn∞₧ vklßdßm prozodickΘ znaΦky. KonkrΘtn∞ slovnφ p°φzvuk a slovnφ rßz.
SyntΘzu °eΦi provßdφm váΦasovΘ oblasti. Tato metoda je relativn∞ v²poΦtov∞ nenßroΦnß. Pam∞¥ovß nßroΦnost je zßvislß na mno₧stvφ a kvalit∞ dat. Jako stavebnφ jednotku pou₧φvßm alof≤n, kter² p°estavuje fonΘm vár∙zn²ch poziΦnφch variantßch dan²ch lev²m i prav²m kontextem, ve kter²ch se fonΘm nachßzφ. M∙j syntezßtor mß kádispozici akustickΘ znalosti o velikosti 300 8-bitov²ch vzork∙ alof≤n∙ o frekvenci vzorkovßnφ 11 kHz. Toto mno₧stvφ je srovnatelnΘ sájin²mi komerΦnφmi syntezßtory a je dßno kvantitativnφm v²zkumem souΦasnΘ mluvenΘ ΦeÜtiny. Program a formßt dat je navrhnut tak, aby bylo mo₧nΘ sákvalitou a kvantitou akustick²ch znalostφ libovoln∞ manipulovat. Pam∞¥ovou nßroΦnost lze ovlivnit volbou re₧imu Φinnosti knihovny syntezi °eΦi (Minimßlnφ/Maximßlnφ).
Co se t²Φe p°enositelnosti na ·rovni zdrojov²ch text∙, je modul fonetickΘ transkripce a modul syntΘzy napsßn vájazyce ANSI-C. ImplementaΦn∞ zßvisl² je jen ovladaΦ zvukovΘ karty. OvladaΦ zvukovΘ karty jsem vytvo°il jak pro prost°edφ DOSu pro kartu Sound Blaster, tak pro prost°edφ MS Windows. Jako problΘm se ukßzala existence r∙zn²ch druh∙ k≤dovßnφ ΦeÜtiny. Proto datovΘ soubory a ΦßsteΦn∞ i hlaviΦkovΘ soubory musφ existovat ve vφce variantßch dle k≤dovßnφ ΦeÜtiny.
Na zßv∞r je nutnΘ poznamenat, ₧e i kdy₧ je vásouΦasnΘ dob∞ vytvo°eno mnoho °eΦov²ch syntezßtor∙, p°esto nejobtφ₧n∞jÜφ ·loha vátΘto oblasti, tj. konverze textu na °eΦ, zatφm zcela uspokojiv∞ vy°eÜena nebyla. P°ed odbornφky stojφ toti₧ zatφm Φasto opomφjen² krok, kter² p°edstavuje vΦlen∞nφ v²sledk∙ sΘmantickΘ anal²zy a jazykovΘho rozboru zpracovßvanΘho textu do °φzenφ prozodick²ch p°φznak∙ °eΦi. Proto lze jen souhlasit sátvrzenφm Jana Zimmermana, ₧e dokud nebude jazykov² rozbor p°irozenΘho jazyka souΦßstφ syntezßtor∙, budou vÜechny um∞lΘ hlasy pouh²m souborem faleÜn∞ kvßkajφcφch robot∙.
Ing. Radim Bßrta
Vedoucφ DP: Ing. LaΦezar LiΦev, CSc. Oponent: Ing. Radim Tvardek