V minulém ƒísle jsme otiskli první ƒást ƒlánku o renderování prostorového zvuku. Jejím obsahem byl popis základních principà τí²ení zvuku v akustickém prostoru a prostorového slyτení.
Dnes se budeme v╪novat metodám modelování zvukového pole. Nejd²íve uvedeme n╪kolik algoritmà a pak pohovo²íme o existujících technologiích a uvedeme n╪které aplikace.
Nejen grafika je 3D (2. ćst)
Metody modelování
Poƒátky modelování zvukov∞ch polí lze rozpoznat v dob╪, kdy si v╪dci uv╪domili, ºe nutnou podmínkou pro realistickou reprodukci zvuku je zam╪stnat ob╪ uτi rozdíln∞mi signály.
Podle poƒtu kanálà záznamu zvuku rozliτujeme záznamy na monofonní, stereofonní atd. Vzhledem k obsahu p²edchozích odstavcà je evidentní, ºe pouh∞ monofonní signál není s to nést informaci o umíst╪ní zdroje zvuku. Ani prost∞ stereofonní signál, jehoº zdroj màºe b∞t umíst╪n více vlevo nebo vpravo, není dostateƒn╪ realistick∞. A p²esto nám staƒí pouze dv╪ uτi, abychom vnímali prostor kolem sebe. Proto nutn╪ musí také staƒit dva kanály zvukového signálu, ve kterém vτak musí b∞t p²ítomny veτkeré v∞τe popsané stopy. Takov∞ signál se naz∞vá binaurální.
Existují vτak jeτt╪ metody, které pouºití sluchátek nep²edpokládají. V první ²ad╪ se jedná o nejràzn╪jτí extendery stereofonního signálu, nap². o Spatializer a Qsound, které marketing chybn╪ naz∞vá "3D Sound" nebo "3D Stereo". Tyto metody spoƒívají v modifikaci jiº existujícího stereofonního signálu pomocí ràzn∞ch filtrà. Nejde vτak o p²esné umís£ování zdrojà do prostoru, jen o jakési "zprostorn╪ní" zvukového vjemu, které se vτak úsp╪τn╪ rozchází s fyzikální realitou.
Dále existují technologie zaloºené na zv∞τení poƒtu kanálà a reproduktorà, takºe zvuk p²ichází z více zdrojà souƒasn╪. To je tzv. surround, na n╪mº jsou zaloºeny technologie Prologic a AC-3. Jsou vhodné pro záznam a reprodukci zvukového signálu tam, kde je více posluchaƒà na ràzn∞ch místech - tj. nap². v kinech. Popis t╪chto metod se vτak vymyká zam╪²ení tohoto ƒlánku, proto se jim v╪novat nebudeme.
Zam╪²me se na metody generování binaurálního signálu. V╪tτina takov∞ch metod se skládá ze dvou ƒástí: z v∞poƒtu impulzní odezvy akustického prostoru pro zadanou polohu posluchaƒe a zdroje zvuku a z její následné aplikace na zvuk emitovan∞ zdrojem. V╪tτinou p²edpokládáme bodov∞ zdroj zvuku a homogenní prost²edí, takºe zdroj zvuku je vlastn╪ zdroj "monofonního" signálu.
V╪nujme se nyní v∞poƒtu impulzní odezvy prostoru. ⁿada metod je zaloºena na principech geometrické akustiky pracující se zvukov∞mi paprsky, které se chovají velmi podobn╪ jako paprsky sv╪telné: Mají zdroj, zachovávají sm╪r vyslání aº do jejich odrazu, jsou postupn╪ utlumovány pràchodem prost²edím a odrazy a nesou urƒitou energii (kompletní monofonní signál). Dopadne--li takov∞to odraºen∞ paprsek do ucha, slyτíme ozv╪nu. Celková délka takového paprsku urƒí zpoºd╪ní p²íchodu signálu do ucha vzhledem k dob╪ vyslání.
Pro geometricky jednoduché scény je moºné pouºít metodu zrcadlov∞ch obrazà. Princip této metody, b╪ºn╪ uºívané nap². i v teorii elektromagnetického pole, je znázorn╪n na obr. 1. Pro kaºdou st╪nu, která se vyskytuje ve scén╪, zkonstruujeme zrcadlov∞ obraz, kde osa zrcadlení prochází st╪nou. V míst╪, kde paprsek z virtuálního zdroje prochází st╪nou, spoƒítáme jeho utlumení, jako kdyby tam byl odraz. Nev∞hoda této metody spoƒívá jednak v poºadavku jednoduchosti modelované scény, jednak, a to hlavn╪, v exponenciální závislosti sloºitosti na poºadovaném maximálním ²ádu odrazà v ozv╪nách.
Dalτí moºností je pak metoda trasování paprsku. Je zaloºena na pokusném vysílání paprskà ze zdroje - vypoƒítáváme jejich odrazy a útlumy a zjiτ£ujeme, zda nezasáhnou model posluchaƒova ucha (obr. 2). Generátor paprskà vτak musí zajistit, aby tvo²ily stejnom╪rné radiální pole. Bu╘ jsou sm╪ry voleny náhodn╪ (Monte Carlo raytracing), nebo nap². postupn╪ procházejí vτemi vrcholy geodetické koule.
Ob╪ tyto metody vτak neumoºσují poƒítat s fenoménem ohybu zvuku. To ƒásteƒn╪ ²eτí metoda trasování (obecného) kuºele (viz [2]). Ta p²edpokládá, ºe zdroj zvuku je mnoºina kuºelà vyplσující cel∞ prostorov∞ úhel. Metoda spoƒívá ve vyτet²ování pràniku podstavy kuºele s p²ekáºkami ve scén╪. Cel∞ princip zobrazuje obr. 3. Vyskytne-li se posluchaƒ uvnit² kuºele, je zapoƒítána ozv╪na. Ohyb zvuku je moºné simulovat p²idáním urƒité ƒásti k té ƒásti kuºele, která pokraƒuje dále prostorem (na obrázku znázorn╪na mod²e).
P²esn╪jτí metody, i kdyº nároƒn╪jτí na v∞poƒetní v∞kon, jsou nejràzn╪jτí numerické aproximace, nap². metoda koneƒn∞ch prvkà.
Jak jsme ²ekli, druhou ƒástí modelování prostorového zvuku je aplikace impulzní odezvy na signál vystupující ze zdroje. Toho docílíme konvolucí signálu s impulzní odezvou. Konvoluci nám p²iblíºí obr. 4, na kterém vidíme základní princip diskrétní konvoluce. Jedná se o proces velmi nároƒn∞ na v∞poƒetní v∞kon poƒítaƒe vzhledem k tomu, ºe pro kaºd∞ vzorek vstupního signálu je nutné provést velké mnoºství aritmetick∞ch operací.
Na vstup konvoluce p²icházejí vzorky vstupního signálu a vzorky impulzní odezvy. Pro kaºd∞ vzorek impulzní odezvy se provede zesílení (zeslabení) vstupního signálu vynásobením vτech jeho vzorkà prvním vzorkem impulzní odezvy. Vznikl∞ signál je uloºen do mezipam╪ti. Pak se stejná operace provede pro druh∞ vzorek impulzní odezvy, ale v∞sledn∞ signál je uloºen do mezipam╪ti posunut∞ o jedno pam╪£ové místo. Podobn╪ se pokraƒuje aº do konce impulzní odezvy. Nakonec jsou seƒteny vτechny stejnolehlé vzorky vτech signálà v mezipam╪ti a jejich souƒet je signál vystupující z konvoluce.
Cel∞m procesem je nutné projít dvakrát vzhledem k tomu, ºe nejd²íve je aplikována impulzní odezva levého a pak pravého ucha.
Obsah p²edchozího textu shrnuje blokové schéma typického binaurálního reverberátoru na obr. 5. Model scény p²ibliºn╪ uprost²ed obrázku p²ijímá informaci o poloze zdroje zvuku a posluchaƒe a na jejím základ╪ vypoƒítá impulzní odezvu pro levé a pravé ucho. Impulzní odezva spolu s monofonním signálem ze zdroje vstupují do p²ísluτn∞ch konvolucí, ze kter∞ch pak vystupují dva kanály stereofonního binaurálního signálu.
V∞τe popsané metody umoºσují velmi kvalitní simulaci zvukového pole, nicmén╪ proti nim hovo²í jejich velká v∞poƒetní nároƒnost, která prakticky vyluƒuje jejich pouºití v systémech poºadujících v∞poƒet prostorového zvuku v reálném ƒase (virtuální realita atd.). Proto bylo vyvinuto mnoho metod zaloºen∞ch na podstatném zjednoduτení metody v∞poƒtu impulzní odezvy a konvoluce.
Je moºné nap². rozd╪lit scénu na urƒité objemové jednotky, pro kaºdou vypoƒítat impulzní odezvu a v∞sledky uloºit do databáze scény (tzv. celulární aproximace). V∞poƒet impulzní odezvy v daném bod╪ v reálném ƒase je pak redukován na nalezení nejbliºτího bodu v databázi, pro kterou jiº impulzní odezvu známe, a na její naƒtení z databáze (obr. 6).
Dalτí moºností je najít pouze n╪kolik odrazà niºτích ²ádà a ostatní aproximovat statistick∞m modelem. Je totiº známo, ºe délka dozvuku je úm╪rná objemu místnosti a obálka impulzní odezvy s ƒasem exponenciáln╪ klesá. Sníºení nároƒnosti konvoluce je dosaºeno nap². zkrácením filtru IR (na obr. 4 by bylo mén╪ ²ádkà) nebo zmenτením vzorkovací frekvence vstupního signálu (mén╪ sloupcà).
Aplikace
Binaurální vnímání p²ináτí celou ²adu dalτích schopností sluchu neº jen schopnost lokalizovat zvukov∞ zdroj v prostoru. V roce 1953 popsal E. C. Chery efekt koktejlového veƒírku (Cocktail-party effect): "Slyτí-li ƒlov╪k zvuk z n╪kolika nezávisl∞ch zdrojà najednou, je schopen je od sebe rozliτit." Posloucháme-li nap². v recepci ²eƒ jednoho ƒlov╪ka, rozumíme mu, i kdyº krom╪ n╪j mluví v místnosti jeτt╪ osm dalτích lidí. Kdyº vτak ze stejného místa po²izujeme monofonní nahrávku, p²ijdeme o moºnost ²eƒníky od sebe rozliτit.
Renderování zvukov∞ch polí umoºσuje ²eτit velmi mnoho zajímav∞ch a dàleºit∞ch úloh. Mnoho jich spadá do oblasti architektury, nap². návrh koncertních sálà a poslucháren. Dnes jiº existuje ²ada síní postaven∞ch podle v∞sledkà, které tato technologie poskytla. Jako p²íklad uve╘me systém Ramsete, kter∞ navrhl prof. Andreo Farina z univerzity v italské Parm╪. Tento systém umoºσuje interaktivn╪ simulovat τí²ení zvuku v uzav²en∞ch prostorech, jako jsou divadelní sály, tovární haly apod.
Tent∞º autor navrhl metodu simulace τí²ení m╪stského hluku. S vyuºitím jeho metody je nap². moºné efektivn╪ navrhovat nejràzn╪jτí akustické bariéry kolem silnic.
Hudební studia vyuºívají poznatkà prostorové akustiky k vytvá²ení nejràzn╪jτích um╪l∞ch dozvukà jiº mnoho let. Zvukov∞ snímek je po²ízen v hudebním studiu, které má pokud moºno nulov∞ dozvuk, a je poté tzv. nahalen. Posluchaƒ pak má pocit, ºe se nahrávalo nap². v kostele. Teprve vτak v∞poƒetní technika p²inesla v╪tτí flexibilitu a vyττí kvalitu takov∞ch systémà.
P²irozené jsou aplikace prostorového zvuku ve virtuální realit╪ a v poƒítaƒov∞ch hrách. V nich je schopnost zvukového systému poskytovat v∞sledky v reálném ƒase nutnou podmínkou pouºitelnosti.
Nicmén╪ i pro podstatn╪ závaºn╪jτí obory lidské ƒinnosti znamená aplikace prostorového zvuku p²ínos. Jedná se o nejràzn╪jτí profese, jejichº hlavní náplní je rychlé ²eτení mnoºiny oƒekávateln∞ch problémà s málo predikovateln∞m v∞skytem. Máme zde na mysli piloty letadel, dispeƒery letového provozu, zam╪stnance elektráren, léka²e atd.
Vyskytne-li se problém, je zvykem nejràzn╪jτích kontrolních panelà zapnout bzuƒák a rozblikat p²ísluτnou kontrolku. Odpov╪dná osoba vypne zvukov∞ alarm a hledá v záplav╪ svítících kontrolek tu, která indikuje závadu. Kdyby vτak byl zmín╪n∞ zvukov∞ signál vyslán pomocí systému generujícího prostorov∞ zvuk, nebyl by problém zam╪²it se p²ímo na oblast kontrolního panelu, kde se vyskytl problém. Pilotovi stíhacího letounu by zvukové upozorn╪ní na τpatn∞ stav motoru p²iτlo z míst, kde se skuteƒn╪ motor vyskytuje. Navíc by mohl p²ijmout n╪kolik takov∞ch upozorn╪ní najednou vzhledem k tomu, ºe by kaºdé bylo lokalizováno jinde.
Technologie
Souƒasn∞ v∞voj jiº p²im╪l technologie opustit stadium poƒáteƒních experimentà a objevují se první standardy. Firma Aureal Semiconductor specifikovala standard A3D Interactive, popisující soubor vlastností a funkcí, které by m╪l zvukov∞ systém splσovat a podporovat (nap². maximální poƒet zvukov∞ch zdrojà, sloºitost scény, Doppleràv efekt apod.), a zároveσ vyvinula technologii, která tento standard implementuje.
Jedná se o zvukov∞ engine urƒen∞ pro osobní poƒítaƒe, kter∞ renderuje t²írozm╪rn∞ zvuk v reálném ƒase v závislosti na zadané geometrii scény (seznam st╪n a jejich fyzikálních vlastností) a polohách posluchaƒe a zdrojà zvuku.
Existují dva hlavní typy implementací - softwarov∞mi knihovnami a hardwarov╪ v podob╪ ƒipu, kter∞ je integrován ve zvukové kart╪. Hardwarová implementace p²ináτí velké odlehƒení procesoru, kter∞ tak nemusí provád╪t v∞poƒet impulzní odezvy a konvoluci. Softwarové knihovny mají tu v∞hodu, ºe pro jejich funkci pln╪ postaƒuje obyƒejná zvuková karta, ale v╪tτinou jsou n╪jak∞m zpàsobem omezeny (nap². neprovádí v∞poƒet odrazà).
V souƒasnosti jiº existuje na trhu n╪kolik typà zvukov∞ch karet, které standard A3D podporují. Jedná se nap². o v∞robky firem Diamond Multimedia (²ada Monster Sound), Turtle Beach (Mondego A3D), TerraTec Promedia (XLerate).
Z her jmenujme nap². Descent: FreeSpace (Interplay), Half-life (Sierra), Blood 2 (patche od firmy Monolith), Duke Nukem Forever (GT Interactive), Jedi Knight (LucasArts) nebo Quake II (Activision).
Tímto odstavcem uzavíráme základní p²ehled termínà a technologií t∞kajících se prostorového zvuku. ¼lánek jsme povaºovali za vhodné vydat vzhledem k velmi rychlému v∞voji této oblasti. Doplσuje jej soubor ukázek binaurálních zvukov∞ch signálà uloºen∞ch na Chip CD.
Záv╪rem by autor rád pod╪koval docentu Pavlu Slavíkovi z katedry poƒítaƒà Fakulty elektrotechnické ¼VUT za mnoho cenn∞ch rad.
Adam J. Sporka (sporkaa@cs.felk.cvut.cz)
Reference
[1] F. Kolmer, J. Kyncl - Prostorová akustika.
[2] A. Farina, P. Galaverna, G. Truffelli - "Ramsete" un nuovo software per la previsione del campo sonoro in teatri, ambienti industriali ed ambiente esterno.
[3] T. Funkhouser, I. Carlbom, G. Elko, G. Pingali, M. Sondhi, J. West - A Beam Trancing Aproach to Acoustic Modeling for Interactive Virtual Environments, SIGGRAPH '98.
[4] E. C. Cherry - Some experiments on the recognition of speech with one or two ears (1953).
[5] J. ªára, B. Beneτ, P. Felkel - Moderní poƒítaƒová grafika.