Na malém místě hodně muziky

Audio kodéry

Formát pro ukládání audio dat MP3 používá nebo o něm minimálně slyšel snad každý. Jeho podstatou je algoritmus vyvinutý Frauenhoferským institutem, který komprimuje hudební soubory v závislosti na výsledné kvalitě na asi jednu desetinu jejich původní velikosti a splňuje tak předpoklady pro internetovou výměnu, přenosné přehrávače a mobily vyšší třídy.

Není tedy divu, že nezůstalo jen u MP3 a formáty mp3PRO, OGG Vorbis nebo WMA chtějí z tohoto koláče také něco ukousnout. Některé tyto kodéry komprimují ještě efektivněji a znějí dokonce ještě lépe.

Postupy MP3 komprese
Aby bylo možno vytvořit z obrovských audio souborů, které se nacházejí na CD, úsporné MP3, OGG a WMA soubory, je zapotřebí použít speciálního postupu převádění originálů. Každý z těchto postupů pracuje pomocí komprimace, při níž dochází ke ztrátě velkého množství (pro lidské ucho co nejméně potřebných) dat.

Na příkladu MP3 si ukážeme, jak kodéry postupují. Začíná se rozdělením souborů do framů, přičemž každý frame obsahuje 26 milisekund. Jedna sekunda tedy obsahuje 38 framů. Každý frame má záhlaví, které obsahuje základní informace a jehož velikost je 32 bitů. Níže jsou tři nejdůležitější postupy komprimace, s nimiž kodér pracuje uvnitř každého framu.

Psychoakustický model
Psychoakustický model napodobuje lidský sluch matematicky a definuje jeho schopnosti vnímání (např. zvuky nad 16 kHz jsou pro člověka s přibývajícím věkem jen slabě nebo vůbec slyšitelné). Mimoto ucho ze dvou po sobě jdoucích tónů s podobnou barvou zvuku slyší podrobně jen ten hlasitější. Psychoakustický model tyto lidské slabiny zná, matematicky je definuje a shrnuje výsledky do tabulek. Při komprimaci porovnávají kodéry výstupní signál s tabulkou a ořezávají odpovídající frekvence. Technickou výzvou pro kodéry je lépe přizpůsobit psychoakustický model lidskému sluchu.

Joint Stereo
Originální soubor: Joint Stereo využívá tu skutečnost, že na obou kanálech často bývá stejný signál.
Komprimovaný soubor: Pravý kanál obsahuje součet obou kanálů, levý jen rozdíl. Dekodér reprodukuje později signál správně dekódovaný.

Důvod, proč se těchto formátů obává i mocný hudební průmysl je jasný - logicky se mu nelíbí, že skladby, za které by se mělo platit, jsou tak snadno a bez jeho vědomí duplikovatelné.
Příjemné je, že všechny formáty fungují stále s nejdůležitějšími softwarovými přehrávači jako je např. Winamp - dekodéry jsou integrovány nebo použitelné jako plug-iny. Pouze u hardwarových přehrávačů je zapotřebí obezřetnosti, ne každý ovládá WMA nebo mp3PRO, OGG zatím neumí žádný.

Důležitým srovnávacím kritériem pro náš test je komprese. Ale protože rozdíly v této kategorii jsou stále menší, byl pro nás rozhodujícím kritériem subjektivní poslechový dojem, doplněný množstvím naměřených údajů - viz srovnávací tabulka.

Stupně kvality u MP3

Bitrate Komprese Kanály Odpovídající kvalita
8 kbit/s cca 88:1 mono telefonní hovor
64 kbit/s cca 24:1 stereo UKW rádio
128 kbit/s cca 15:1 stereo špatná CD kvalita
192 kbit/s cca 12:1 stereo pravá CD kvalita

LAME 3.92 [http://www.mp3dev.org/mp3]
Opravdový král mezi kodéry, které vytvářejí formát MP3, má jméno LAME. Frauenhoferský originál předstihne nejen v kvalitě, ale i konfigurovatelnosti - milovník hudby ho může dokonale přizpůsobit svým potřebám. Variabilní datový tok (bitrate), Joint Stereo a propracované profily se starají o odpovídající poměr mezi kvalitou a mírou komprese.

Jak to, že LAME nabízí o tolik více? Odpověď je stejně tak jednoduchá jako poučná a zní Open Source. Oproti Frauenhoferskému kodéru stojí za LAMEm celé společenství vývojářů, které ho neustále vylepšuje a vydává téměř pravidelně, vždy za několik týdnů, novou verzi, která je založena na optimalizovaném psychoakustickém modelu.
Opravdu dobrý je LAME až od verze 3.91. Umožňuje kódování pomocí profilů (Presets), které využívají schopností kodéru a jsou ulehčením hlavně u variabilních bitrate. Uživatel může díky němu například nastavením "alt-preset standard" vytvořit MP3 soubor o vysoké kvalitě, ale přesto tento soubor není o mnoho větší než stejná nahrávka kódovaná na 128 kbit/s. Při této metodě šetří kodér bitrate na klidných místech a přidává ho komplexních pasáží.

Přesto však zůstává LAME MP3 kodérem - to znamená, že u nízkých bitrate jako 64 kbit/s nemilosrdně ořezává vysoké frekvence a zkresluje zvuk. Body ale sbírá ve věrnosti originálu při 128 kbit/s. Tam už musí posluchač nastražit uši, aby rozlišil originál a výstup LAME.

lame-3.92.zip [freeware, 0,5 MB]

Základní pojmy

Bitrate (datový tok): Počet bitů, které jsou použity na jednu sekundu (komprimovaného) záznamu.
Sampling rate (vzorkovací frekvence): Počet vzorkování, který provádí CD přehrávač za sekundu.
CBR (konstantní bitrate):
Skladba je kódována konstantně jedním bitrate. Kodér nezohledňuje výkyvy v písni. Soubor je většinou větší než při VBR a u pasáží s velkým počtem hudebních informací nezní tak dobře.
VBR (variabilní bitrate): Kodér se řídí podle písně. U klidných míst bitrate šetří, přidává ho u intenzivnějších partií. Kvalita je většinou vyšší.
ABR (průměrný bitrate): Skladba má v průměru nastavený jeden bitrate, výkyvy jsou ale v celé písni možné.

Microsoft WMA 9 RC2 [http://www.microsoft.com]
Podívejme se blíže na zástupce stáje Microsoft. Již náš test předchozí verze 8 ukázal, že WMA je podstatně lepší, než jeho pověst nebo pověst jeho výrobce. Finální verze 9 zatím není, k dispozici je v pořadí druhý kandidát, který se bude lišit jen nepatrně. Za špatný image WMA si ale může Microsoft sám, protože když přišel tento audio formát na trh, neudržel krok s formátem MP3. Navíc si Microsoft rozzlobil hudební fanoušky tím, že do WMA zabudoval Digital Rights Management (DRM) jako způsob ochrany proti kopírování - ten byl ale krátce nato prolomen.

Až WMA kodér splňuje sliby Microsoftu vyprodukovat dobrou kvalitu i při bitrate 64 kbit/s (to začíná být zajímavé, protože se objevují přenosné přehrávače s podporou WMA). CD kvality, kterou MP3 slibuje při 128 kbit/s, ale WMA při poloviční bitrate nedosahuje.

Obecně je WMA při nižších datových tocích lepší než MP3, rozdíl ale rozhodně není propastný, jak tvrdí Microsoft. Ve vyšších frekvencích je kvalita srovnatelná, při 64 kbit/s si konkuruje s mp3PRO. Pokud tedy někdo musí nutně šetřit místem, pro toho je WMA tou pravou volbou. U tohoto nástroje opět přichází ke slovu firemní politika Microsoftu a kódování hudby pomocí WMA je jednoduché, profily pro standardní datové toky jsou přednastaveny - zvládnou je tedy i začátečníci v oblasti kódování. Úplně jinak to ale vypadá, pokud chce uživatel WMA soubor konvertovat do jiného formátu - i když třeba jen do WAVu. V tomto případě Microsoft nenabízí vůbec nic a přenechává pole působnosti programům jiných výrobců jako např. dBpowerAMP (www.dbpoweramp.com), které tyto služby přejímají.

WMEncoder.exe [freeware, 9,4 MB]

Spojení bitů
Při přehrávání audio signálu CD přehrávačem jsou digitální informace skladby zapisovány do tzv. vzorků. CD přehrávač se vzorkovací frekvencí (sampling rate) 44,1 kHz vzorkuje CD za jednu sekundu 44.100x. To dává dohromady 1.152 vzorků na jeden frame. Každý vzorek se skládá z určitého počtu bitů, v případě 16 bitového kódování tedy ze 16ti bitů. Pokud tento bitový vzor začíná hodnotami 000000, lze těchto šest nul vynechat. Prostřednictvím informace v záhlaví ví dekodér při přehrávání, že z 10ti bitového signálu musí vyčarovat signál 16 bitový doplněním chybějících bitů.

16ti bitový kód
0000001010110010

komprimovaný kód
0000001010110010

Coding Technologies mp3PRO [http://www.mp3prozone.com]
Vážný nedostatek MP3 spočívá v tom, že kvalita zvuku při 64 kbit/s drasticky klesá. Právě tady navazuje mp3PRO: Coding Technologies vyvinula techniku nazvanou "Spectral Band Replication", zkráceně SBR. Vylepšený kodek zachovává vysoké frekvence, takže již při 64 kbit/s má být dosaženo kvality CD. Ve skutečnosti to funguje tak, že mp3PRO výšky sice ořezává také, ale při přehrávání je umí znovu rekonstruovat. Jak ale kodér ví, které frekvence zpětně vylepšit? Velice jednoduše: Mp3PRO komprimuje nízké frekvence normálním mp3 způsobem a informace o vysokých frekvencích ukládá v oblasti hlubokých tónů (tedy opět nízkých frekvencí).

V poslechovém testu SBR technologie dokazuje, co umí. Dobrá kvalita zvuku při 64 kbit/s nás přesvědčila o jeho výhodách, jen WMA se nám zdálo o něco málo věrnější originálu. Od tvrzení "CD kvalita" při 64 kbit/s jsme ale upustili.

mp3PROAudioPlayer_v1_1_0.exe [demoverze, 1,1 MB]

Úspora místa: Ořezání vysokých tónů
U vysokých frekvencí, které lidské ucho může sotva vnímat, oříznou kodéry všechny informace, které obsahuje originální WAV.

Frauenhofer MP3 Encoder [http://www.iis.fhg.de]
Originální kodér vykazuje první příznaky stárnutí a musí v oblasti kvality zvuku přenechat vedení programu LAME. A to i poté, co Frauenhoferský institut doplnil vlastní MP2Enc31 o FastEnc.

Spotřebitelské balíky jako MusicMatch, které sází na Frauenhofer, využívají většinou oba kodéry podle požadavku - vysoký bitrate (MP3Enc31) nebo vysoká rychlost (FastEnc).
V testu Chipu potvrdil Frauenhofer kodér bohužel svoji špatnou pověst, pokud se jedná o nízké datové toky - při 64 kbit/s výšky radikálně ořezává, a výsledek zní jako z podzemí. Konkurence nezachází při této komprimaci tak daleko a ponechává frekvence vyšší. Teprve při bitratech 128 kbit/s a výše poskytuje Frauenhofer slušnou kvalitu, i když nedosahuje ani kvality programu LAME ani sílu zvuku programu OGG Vorbis.

Při konfiguraci sice uživatel může dosáhnout přes Joint Stereo a variabilní datové toky optimálního výsledku, ale software, přes který uživatel kodér nastavuje, zpravidla už není freeware. Kdo chce do svého programu zabudovat Frauenhofer kodér, musí platit - a sice asi 15.000 dolarů základní poplatek a mezi 0,50 a 2,50 dolary za každý prodaný produkt. To je cena, kterou výrobce dále přesouvá směrem na spotřebitele. Dříve za něj sice spotřebitel ochotně platil, protože byl po dlouhou dobu, co se kvality týče, zdaleka nejlepší.

Variabilní bitrate
Optimální kvalita díky chytrému komprimování
Aby mohly kodéry uložit co možná nejvíce na co nejméně místa, používají jeden trik: Obzvláště klidné pasáže komprimuje kodér jen 32 kbit/s. Tím jsou k dispozici vyšší datové toky pro dynamičtější místa, která aby zněla dobře, potřebují více informací - až 320 kbit/s

Blade Encoder 0.942 [http://bladeenc.mp3.no]
Pradávný Open Source kodér (již nevyvíjený) patří již v současné době spíše do muzea. Při pohledu na průběh frekvencí je zřejmé proč. Tam, kde ostatní kodéry při 64 kbit/s výšky jen ořezávají, provede Blade 0.942 neodpustitelné výřezy, které se negativně podepíší na kvalitě zvuku.

Z bílého šumu (obsahuje všechny frekvence od 20 Hz do 20 kHz), které jsme v testu použili pro měření průběhu frekvencí, udělal Blade komprimátor opotřebovaný bílý skřípot. Všechny ostatní kodéry znějí při tomto bitrate mnohem lépe.

Negativní dojem trval i při poslechovém testu zkušební písně. Při šířce pásma 64 kbit/s zní Blade kodér zdaleka nejhůře. Kde ostatní hrají alespoň napůl přirozeně, tam to u Blade kodéru z našich až hříšně drahých reproduktorů testovací soupravy chrastí a drnčí. Ani nemluvě o příšerných zkresleních v oblasti vysokých tónů.

Při 128 kbit/s už to však vypadá o trochu lépe a to se odráží také v průměrném hodnocení "uspokojivý", kterého Blade dosáhl i přes své umístění až na úplném konci. Zvukový obraz je při tomto bitrate podstatně vyváženější. Označení "téměř CD kvalita" jsme ale přesto udělit nemohli. Na závěr nám zůstává poznatek, že Blade s konkurencí krok neudrží.

Zmiňme se dále i o dvou dalších formátech, se kterými se setkáme jen zřídka:

MPC/MPEGplus [http://www.musepack.org]
Tento méně známý formát vychází obdobně jako MP3 z vrstvy MPEG1, v tomto případě z Layer 2. Testy jsme zjistili, že jeho slabinou jsou nízké datové toky. Přesto se do něj vkládají opodstatněné naděje. Musepack je tzv. subband kodek, což znamená, že vstupní signál je rozložen do celkem 32 dílčích pásem. Každé z těchto pásem může kodek jednotlivě upravovat a optimalizovat. Předností je, že při vyšších bitrates od 160 kbit/s docílí MPC slyšitelně lepších výsledků než AAC nebo MP3. MPC je proto ideální pro archivaci hudby.

mppenc-windows-1.1.zip [freeware, 405 kB]



AAC/MP4 [http://www.audiocoding.com]
Kodek je součástí standardu MPEG-4 a nabízí vícekanálový zvuk. Kvalita AAC je opravdu dobrá až od 96 kbit/s. Při bitrate nad 100 kbit/s poskytuje AAC kvalitu zvuku, kterou jen tak něco nepřekoná. AAC formát je zatížen licenčními poplatky, proto také uživatele přijde na pěkný peníz.

aacenc_v215.zip [demoware (pro soukromé užití zdarma), 0,7 MB]


OGG Vorbis 1.0 - vítěz testu  [http://www.vorbis.com]
Open Source kodér bojuje s Microsoftem, nemá respekt ani před Frauenhoferským institutem a loučí se s MP3.
Dostatečně rychlý, dobrý a zadarmo - tyto tři atributy charakterizují již v roce 1993 vyvinutý a na Open Source založený kodér OGG Vorbis. Míra rozšíření je sice ještě výrazně nižší než je tomu u MP3, ale i přesto se stává OGG ve stále větší míře možnou alternativou. To je zřejmé i z toho, že již krátce po objevení na trhu byly k dispozici plug-iny pro Winamp, Sonique a FreeAmp. V nových verzích audio programů je již jeho podpora standardní.

Z oficiálních webových stránek je k dispozici jednoduchý kodér z příkazové řádky a drag&drop aplikace, která ihned provádí převod vtáhnutých souborů. Navíc grafických prostředí usnadňující převod souborů je již řada (jmenovitě na tomto CD winLAME, dBpowerAMP).

V oblasti kvality zvuku boduje OGG na celé čáře. Kodér komprimuje audiodata o něco více než MP3 kodér Frauenhoferského institutu, přesto je kvalita zvuku při stejné velikosti jednoznačně lepší. Toto plus je vyvažováno mírně pomalejším enkódováním a vyšším zatížením procesoru při dekódování než LAME.

Při poslechové zkoušce obstál OGG při 64 kbit/s se známkou "uspokojivý" - a i tak patří k těm nejlepším kodérům. Ostatně hodnocení některých testovaných programů sahá až k velmi špatné známce "nedostatečný" (Blade). Naproti tomu u OGG znějí testované skladby velmi dynamicky a hlasitě, stejně tak u 128 kbit/s. I zde přesvědčí freeware kodér celkově vyváženým zvukovým obrazem s čirými výškami a sytými basy.

vorbis-tools-1.0-win32.zip [freeware, 0,5 MB]


T. Baur, M. Mandau, P. Zákostelný