Technologie kódování hudby a srovnávací test softwarových encodérů a přehrávačů MP3 Na malém místě hodně muziky Formát pro ukládání audiodat MP3 používá nebo o něm minimálně slyšel snad každý. Jeho podstatou je Frauenhoferovým institutem vyvinutý algoritmus, který komprimuje hudební soubory v závislosti na výsledné kvalitě na asi jednu desetinu jejich původní velikosti, a splňuje tak předpoklady pro internetovou výměnu, přenosné přehrávače a mobily vyšší třídy. Není tedy divu, že nezůstalo jen u MP3 a formáty mp3PRO, OGG Vorbis nebo WMA chtějí z tohoto koláče také něco ukousnout. Některé tyto kodéry komprimují ještě efektivněji a znějí dokonce ještě lépe. Důvod, proč se těchto formátů obává i mocný hudební průmysl, je jasný - logicky se mu nelíbí, že skladby, za které by se mělo platit, jsou tak snadno a bez jeho vědomí duplikovatelné. Příjemné je, že všechny formáty fungují stále s nejdůležitějšími softwarovými přehrávači, jako je např. Winamp - dekodéry jsou integrovány nebo instalovatelné jako plug-iny. Pouze u hardwarových přehrávačů je zapotřebí obezřetnosti, ne každý ovládá WMA nebo mp3PRO, OGG zatím neumí žádný. Důležitým srovnávacím kritériem pro náš test je komprese. Ale protože rozdíly v této kategorii jsou stále menší, byl pro nás rozhodujícím hlediskem subjektivní poslechový dojem, doplněný množstvím naměřených údajů. LAME 3.92 Opravdový král mezi kodéry, které vytvářejí formát MP3, má jméno LAME. Frauenhoferský originál předstihne nejen v kvalitě, ale i v konfigurovatelnosti - milovník hudby ho může dokonale přizpůsobit svým potřebám. Variabilní datový tok (bitrate), Joint Stereo a propracované profily se starají o odpovídající poměr mezi kvalitou a mírou komprese. Jak to, že LAME nabízí o tolik více? Odpověď je stejně tak jednoduchá jako poučná a zní - Open Source. Oproti frauenhoferskému kodéru stojí za LAME celé společenství vývojářů, které ho neustále vylepšuje a vydává téměř pravidelně, vždy za několik týdnů novou verzi, která je založena na optimalizovaném psychoakustickém modelu (viz rámeček na str. 32). Opravdu dobrý je LAME od verze 3.91. Umožňuje kódování pomocí profilů (Presets), které využívají schopností kodéru a jsou ulehčením hlavně u variabilních bitrate. Uživatel může díky němu například nastavením "alt-preset standard" vytvořit MP3 soubor o vysoké kvalitě, ale přesto tento soubor není o mnoho větší než stejná nahrávka kódovaná na 128 kb/s. Při této metodě šetří kodér bitrate na klidných místech a přidává ho u komplexních pasáží. Přesto však zůstává LAME MP3 kodérem to znamená, že u nízkých bitrate jako 64 kb/s nemilosrdně ořezává vysoké frekvence a zkresluje zvuk. Body ale sbírá ve věrnosti originálu při 128 kb/s. Tam už musí posluchač nastražit uši, aby rozlišil originál a výstup LAME. Tip: LAME naleznete na Chip CD i jako ACM kodér, je tedy využitelný i v jiných programech pro práci se zvukem (např. Virtual Dub). Microsoft WMA 8 Náš test ukázal, že WMA je podstatně lepší než jeho pověst nebo pověst jeho výrobce. Za špatný image WMA si ale může Microsoft sám, protože když přišel tento audioformát na trh, neudržel krok s formátem MP3. Navíc si Microsoft rozzlobil hudební fanoušky tím, že do WMA zabudoval Digital Rights Management (DRM) jako způsob ochrany proti kopírování - ten byl ale krátce nato prolomen. Až WMA kodér splňuje sliby Microsoftu vyprodukovat dobrou kvalitu i při bitrate 64 kb/s. CD kvality, kterou MP3 slibuje při 128 kb/s, ale WMA při poloviční bitrate nedosahuje. Zvuk se sice originálu hodně blíží, ale zní trochu tlumeně a ztrácí svižnost. Při 64 kb/s ale s kodérem mp3PRO lehce drží krok. Pokud tedy někdo musí nutně šetřit místem, pro toho je WMA tou pravou volbou. U tohoto nástroje opět přichází ke slovu firemní politika Microsoftu a kódování hudby pomocí WMA je jednoduché, profily pro standardní datové toky jsou přednastaveny - zvládnou je tedy i začátečníci v oblasti kódování. Úplně jinak to však vypadá, pokud chce uživatel WMA soubor konvertovat do jiného formátu - i když třeba jen do WAV. V tomto případě Microsoft nenabízí vůbec nic a přenechává pole působnosti sharewarovým programům, jako např. Advanced WMA Workshop (www.litexmedia.com), které tyto služby přejímají. Coding Technologies mp3PRO Vážný nedostatek MP3 spočívá v tom, že kvalita zvuku při 64 kb/s drasticky klesá. Právě tady navazuje mp3PRO: Coding Technologies vyvinula techniku nazvanou "Spectral Band Replication", zkráceně SBR. Vylepšený kodek zachovává vysoké frekvence, takže už při 64 kb/s má být dosaženo kvality CD. Ve skutečnosti to funguje tak, že mp3PRO výšky sice ořezává také, ale při přehrávání je umí znovu rekonstruovat. Jak ale kodér ví, které frekvence zpětně vylepšit? Velice jednoduše: mp3PRO komprimuje nízké frekvence normálním MP3 způsobem a informace o vysokých frekvencích ukládá v oblasti hlubokých tónů (tedy opět nízkých frekvencí). V poslechovém testu SBR technologie dokazuje, co umí. Dobrá kvalita zvuku při 64 kb/s nás přesvědčila o jeho výhodách, jen WMA se nám zdálo o něco málo věrnější originálu. Od tvrzení "CD kvalita" při 64 kb/s jsme ale upustili. Tip: Pokud někdo chce přehrávat mp3PRO soubory v populárním softwarovém MP3 přehrávači Winamp, měl by si nejprve nainstalovat odpovídající plug-in od firmy Thomson. Jen ten totiž umožní opravdový požitek z poslechu ( jiný MP3 dekodér přehraje tento formát také, ale bez výhod mp3PRO) souboru kódovaného v tímto způsobem se vzorkovací frekvencí 44,1 kHz. Plug-in najdete na adrese www.winamp.com. Kodér mp3PRO je též k dispozici v CD vypalovacím balíku Nero. Frauenhofer MP3 Encoder Originální kodér vykazuje první příznaky stárnutí a musí v oblasti kvality zvuku přenechat vedení programu LAME. A to i poté, co Frauenhoferův institut doplnil vlastní MP2Enc31 o FastEnc. Spotřebitelské balíky jako MusicMatch, které sází na Frauenhofer, využívají většinou oba kodéry podle požadavku - vysoký bitrate (MP3Enc31) nebo vysoká rychlost (FastEnc). V testu Chipu potvrdil Frauenhofer kodér bohužel svoji špatnou pověst, pokud se jedná o nízké datové toky - při 64 kb/s výšky radikálně ořezává a výsledek zní jako z podzemí. Konkurence nezachází při této komprimaci tak daleko a ponechává frekvence vyšší. Teprve při bitrate 128 kb/s a výše poskytuje Frauenhofer slušnou kvalitu, i když nedosahuje ani kvality programu LAME ani síly zvuku programu OGG Vorbis. Při konfiguraci sice uživatel může dosáhnout přes Joint Stereo a variabilní datové toky optimálního výsledku, ale software, přes který uživatel kodér nastavuje, zpravidla už není freeware. Kdo chce do svého programu zabudovat Frauenhofer kodér, musí platit - a sice asi 15 000 dolarů základní poplatek a 0,50 až 2,50 dolaru za každý prodaný produkt. To je cena, kterou výrobce dále přesouvá směrem na spotřebitele. Dříve za něj sice spotřebitel ochotně platil, protože byl po dlouhou dobu, co se kvality týče, zdaleka nejlepší. Blade Encoder 0.942 Pradávný Open Source kodér patří už v současné době spíše do muzea. Při pohledu na průběh frekvencí je zřejmé proč. Tam, kde ostatní kodéry při 64 kb/s výšky jen ořezávají, provede Blade 0.942 neodpustitelné výřezy, které se negativně podepíší na kvalitě zvuku. Z bílého šumu (obsahuje všechny frekvence od 20 Hz do 20 kHz), které jsme v testu použili pro měření průběhu frekvencí, udělal Blade komprimátor opotřebovaný bílý skřípot. Všechny ostatní kodéry znějí při tomto bitrate mnohem lépe. Negativní dojem trval i při poslechovém testu zkušební písně. Při šířce pásma 64 kb/s zní Blade kodér zdaleka nejhůře. Kde ostatní hrají alespoň napůl přirozeně, tam to u Blade kodéru v našich až hříšně drahých reproduktorech testovací soupravy chrastí a drnčí. Ani nemluvě o příšerných zkresleních v oblasti vysokých tónů. Při 128 kb/s už to však vypadá o trochu lépe, což se odráží také v průměrném hodnocení "uspokojivý", kterého Blade dosáhl i přes své umístění až na úplném konci. Zvukový obraz je při tomto bitrate podstatně vyváženější. Označení "téměř CD kvalita" jsme ale přesto udělit nemohli. Na závěr nám zůstává poznatek, že Blade s konkurencí krok neudrží. T. Baur, M. Mandau, P. Zákostelný Základní pojmy Bitrate (datový tok) - počet bitů, které jsou použity na jednu sekundu (komprimovaného) záznamu. Sampling rate (vzorkovací frekvence) - počet vzorkování, který provádí CD přehrávač za sekundu. CBR (konstantní bitrate) - skladba je kódována konstantně jedním bitrate. Kodér nezohledňuje výkyvy v písni. Soubor je většinou větší než při VBR a u pasáží s velkým počtem hudebních informací nezní tak dobře. VBR (variabilní bitrate) - kodér se řídí podle písně. U klidných míst bitrate šetří, přidává ho u intenzivnějších partií. Kvalita je většinou vyšší. ABR (průměrný bitrate) - skladba má v průměru nastavený jeden bitrate, výkyvy jsou ale v celé písni možné. Jak jsme testovali Naše testovací platforma sestávala z PC Pentium III s taktovací frekvencí 866 MHz, 128 MB RAM a Windows XP Professional. Pro poslechový test jsme použili stereosoupravu se zesilovačem AVR-7000 od firmy Hartman/Kardon a reproduktory Tl10K od firmy JBL. Kvalita Subjektivní poslechovou kvalitu jsme testovali s několika hudebně zkušenými jedinci. Volby Kodéry se liší i v možnostech nastavení. Hodně bodů zde získá kodér, který mimo konstantního bitrate nabízí také variabilní. Software Kodéry lze většinou integrovat do různých ovládacích ploch. Otestovali jsme, jak velká je nabídka takových nástrojů a kolik který stojí. Měřená data U kodérů je důležitý vedle rychlosti transkódování také stupeň komprimace. Koneckonců cílem je vyčarovat i při vysokém stupni komprimace dobrý zvuk. OGG Vorbis 1.0 Pre RC3 - vítěz testu Open Source kodér nemá respekt ani před Microsoftem ani před Frauenhoferovým institutem a loučí se s MP3. Rychlý, dobrý a zadarmo - tyto tři atributy charakterizují už v roce 1993 vyvinutý a na Open Source založený kodér OGG Vorbis. Míra rozšíření je sice ještě výrazně nižší, než je tomu u MP3, ale i přesto se stává OGG ve stále větší míře možnou alternativou. To je zřejmé i z toho, že už krátce po objevení na trhu byly k dispozici plug-iny pro Winamp, Sonique a FreeAmp. V nejnovější verzi Winampu 2.80 je OGG dokonce standardně integrován. Z oficiálních webových stránek je k dispozici jednoduchý kodér z příkazového řádku a drag & drop aplikace, která ihned provádí převod vtáhnutých souborů. Velmi kvalitní a s možností nastavení základních parametrů je i výstupní plug-in do Winampu, který místo přehrávání ukládá přímo OGG soubory. V oblasti kvality zvuku boduje OGG na celé čáře. Kodér komprimuje audiodata o něco více než MP3 kodér Frauenhoferova institutu, přesto je kvalita zvuku při stejné velikosti jednoznačně lepší. Při poslechové zkoušce obstál OGG při 64 kb/s se známkou "uspokojivý" - a i tak patří k těm nejlepším kodérům. Ostatně hodnocení některých testovaných programů sahá až k velmi špatné známce "nedostatečný" (Blade). Naproti tomu u OGG znějí testované skladby velmi dynamicky a hlasitě, stejně tak u 128 kb/s. I zde přesvědčí freewarový kodér celkově vyváženým zvukovým obrazem s čirými výškami a sytými basy. Celkové hodnocení 4/5 Cena/výkon velmi dobrý Cena freeware Informace www.xiph.org + zdarma + dobrý zvuk + stálý vývoj - při 64 kb/s průměrný zvuk Technické pozadí Postupy MP3 komprese Aby bylo možno vytvořit z obrovských audiosouborů, které se nacházejí na CD, úsporné MP3, OGG a WMA soubory, je zapotřebí použít speciálního postupu převádění originálů. Každý z těchto postupů pracuje pomocí komprimace, při níž dochází ke ztrátě velkého množství (pro lidské ucho co nejméně potřebných) dat. Na příkladu MP3 si ukážeme, jak kodéry postupují. Začíná se rozdělením souborů do framů, přičemž každý frame obsahuje 26 milisekund. Jedna sekunda tedy obsahuje 38 framů. Každý frame má záhlaví, které obsahuje základní informace a jehož velikost je 32 bitů. Níže jsou tři nejdůležitější postupy komprimace, s nimiž kodér pracuje uvnitř každého framu. Psychoakustický model Psychoakustický model napodobuje lidský sluch matematicky a definuje jeho schopnosti vnímání (např. zvuky nad 16 kHz jsou pro člověka s přibývajícím věkem jen slabě nebo vůbec slyšitelné). Mimoto ucho ze dvou po sobě jdoucích tónů s podobnou barvou zvuku slyší podrobně jen ten hlasitější. Psychoakustický model tyto lidské slabiny zná, matematicky je definuje a shrnuje výsledky do tabulek. Při komprimaci porovnávají kodéry výstupní signál s tabulkou a ořezávají odpovídající frekvence. Technickou výzvou pro kodéry je lépe přizpůsobit psychoakustický model lidskému sluchu. Joint Stereo Originální soubor: Joint Stereo využívá tu skutečnost, že na obou kanálech často bývá stejný signál. Komprimovaný soubor: Pravý kanál obsahuje součet obou kanálů, levý jen rozdíl. Dekodér reprodukuje později signál správně dekódovaný. Spojení bitů Při přehrávání audiosignálu CD přehrávačem jsou digitální informace skladby zapisovány do tzv. vzorků. CD přehrávač se vzorkovací frekvencí (sampling rate) 44,1 kHz vzorkuje CD za jednu sekundu 44,100x. To dává dohromady 1152 vzorků na jeden frame. Každý vzorek se skládá z určitého počtu bitů, v případě 16bitového kódování tedy ze 16 bitů. Pokud tento bitový vzor začíná hodnotami 000000, lze těchto šest nul vynechat. Prostřednictvím informace v záhlaví ví dekodér při přehrávání, že z desetibitového signálu musí vyčarovat signál 16bitový doplněním chybějících bitů. Úspora místa - ořezání vysokých tónů U vysokých frekvencí, které lidské ucho může sotva vnímat, oříznou kodéry všechny informace, které obsahuje originální WAV. Následující obrázky zobrazují výsledek komprimace bílého šumu při 128 kb/s. Software na Chip CD LAME 3.92: freeware, www.mp3dev.org/mp3 RazorLame 1.1.5: GUI (graf. prostředí) pro LAME, freeware, www.dors.de/razorlame Blade 0.942: freeware, http://bladeenc.mp3.no RazorBlade 1.4.1: GUI pro Blade, freeware, www.dors.de/RazorBlade Mp3PRO Player/Encoder 1.0.4: demo, kódování pouze 64 kb/s, www.mp3prozone.com Windows Media 8 Encoding Utility: freeware, www.microsoft.com OGG Vorbis 1.0 RC3 + Winamp kodér plug-in: freeware, www.xiph.org