Audiokodéry

Svět po MP3

Moderní audiokodeky jasně předstihnou letitý formát MP3. Vytvářejí totiž kvalitní zvuk při ještě menším datovém toku. Ale který z pěti následovníků MP3 je nyní nejlepší? Když se na trhu objevil formát MP3, způsobilo to v hudebním světě revoluci. Kvalitativně dobré skladby ve formátu MP3 jsou při bitrate (datovém toku) 128 kb/s desetkrát menší než originál. Tím pádem si je uživatelé mohou efektivně vyměňovat po internetu a ukládat na různá média. Ve startovních blocích však už stojí nová generace audiokodeků a měla by být značně lepší než MP3. Od 64 kb/s je slibována zvuková kvalita „blízká CD“, takže uživatel by při přechodu na nový kodér mohl ušetřit dvakrát tolik místa. Skladby jsou při tomto bitrate dvacetkrát menší než originál, a proto také ideální pro živé přenosy po internetu, pro přenosné přístroje nebo vícekanálový zvuk.

Ale jak je to vůbec s CD kvalitou od 64 kb/s? Abychom zodpověděli tuto otázku, zaměřili jsme se v testu na nízké toky od 48 do 80 kb/s. Pokud zde kodéry skutečně dosáhnou kvality CD, pak MP3 se svými 128 kb/s dosloužil.

Nové audioformáty jako AAC nebo WMA9 jsou v každém případě silnější technologie než MP3. Flexibilněji zpracovávají proud zvukových dat a dopřávají obtížnějším pasážím více místa, protože ušetří jinde. Při zpracovávání stereosignálů můžete přesněji ovládat, které informace mají být přeneseny jen jednou, když jsou zároveň vysílány na obou kanálech. Ale naši dva kandidáti v testu, aacPlus a mp3PRO, jdou ještě o krok dál – používají Spectral Band Replication. SBR rekonstruuje vysoké frekvence, které jiné kodéry oříznou, protože je lidský sluch nevnímá. Tato metoda je efektivní právě při bitrate mezi 48 a 64 kb/s, protože právě zde po komprimačním procesu chybí frekvence, které jsou ještě dobře slyšitelné. Absence těchto frekvencí ovlivňuje kvalitu, což se projevuje zpravidla tlumeným zvukem.

Frekvenční průběhy

Ořezávání při komprimaci: vysoké frekvence odpadnou

Vysoké frekvence v původním souboru WAV, které může lidské ucho sotva zaznamenat, kodéry ořezávají. U bitrate 64 kb/s se dosáhne při komprimaci takzvaného bílého šumu (signálu obsahujícího všechny frekvence přibližně ve stejném zastoupení) výsledku, který je zobrazen u každého z popisovaných kodeků.

Nová technologie je tedy slibná, ale to ještě neznamená, že nové kodéry mají šanci se prosadit, protože vedle kvality zvuku představuje u kodérů důležitý faktor také jejich rozšíření. Je málo platné vytvářet silně komprimované, ale stále ještě dobře znějící písně, když si je kvůli nedostatku dekodérů nemůže nikdo přehrát. S rozšířením to platí doposud stejně: MP3 je nyní daleko vpředu, každý milovník hudby jej totiž zná, každý jej může slyšet. Ale to by se mohlo brzo změnit, protože s Nerem 6 je na trhu vypalovací software, který se při bližším ohledání ukázal jako univerzální kódovací stroj. Uživatel nenajde jen implementovaný kodér AAC, ale také aacPlus, jakož i mp3PRO. Navíc jsou na adrese http://neroplugins.cd-rw.org k dispozici freewarové plug-iny pro jiné formáty, než které jsou uváděny v našem testu. Tak můžete přes Nero vyzkoušet všechny nové audiokodéry. K přehrání všech těchto formátů dodává Nero také vhodný nástroj – Nero Media Player. Ale než začnete pracovat s Nerem, přečtěte si v našem testu, do kterého formátu se konvertování opravdu vyplatí.

 

aacPlus

Nováček útočí hned na vrchol žebříčku kodérů: díky SBR produkuje aacPlus nejlepší kvalitu zvuku při nízkém bitrate.


Nero 6 umí namixovat konvertovaný zvukový proud přímo do MP4 videosouboru.

aacPlus není žádný samostatný formát, ale vychází z AAC a používá navíc technologii SBR, aby vytvářel i při nízkém bitrate stále dobrý zvuk. A aacPlus skutečně přináší při 80 a 64 kb/s čistý zvukový obraz. Výrobce, společnost Coding Technologies, slibuje ale již při datovém toku 48 kb/s kvalitu CD. Při povrchním posouzení to souhlasí, protože aacPlus ořezává zvukový signál při 48 kb/s teprve u frekvence16 kHz. Proto dopadl aacPlus při 48 kb/s lépe než například nejlepší MP3 kodek LAME při 128 kb/s. V poslechovém testu se to zcela nepotvrdilo, při 48 kb/s dělal lehké chyby. V Bachově Tokátě a fuze vytvářel aacPlus ozvěnu při vysokých tónech a zvuky varhan ztrácely v určitých pasážích na čistotě.

Tak jako AAC je také aacPlus integrovaný ve standardu MPEG-4 a počítá se s ním jako se zvukovou stopou pro filmy například ve formátu DivX nebo v jeho předpokládaném nástupci H.264. Kodér aacPlus nabízí uživatelům pouze výrobce Ahead ve vypalovacím softwaru Nero 6. Tak jako AAC u Quicktimu, také u Nera je aacPlus sbalen do souboru MP4. Uživatel může proto jednoduše vytvářet proudový (streamingový) soubor MP4 a snadno ho publikovat na internetu pro přímé přehrávání. Navíc nabízí kodér přidání zvukové stopy aacPlus do MP4 videosouboru.

 

OggVorbis

Open Source kodek se těší stále větší oblibě. Je to za prvé z důvodu velmi dobré kvality zvuku u klasického bitrate formátu MP3 – 128 kb/s, za druhé se mezitím OggVorbis stal i při nízkých datových tocích skutečnou konkurencí komerčně prosazovaným konkurentům typu AAC. V poslechovém testu ořízl OggVorbis frekvence při 48 kb/s překvapivě dobře, dokonce o něco lépe než náš vítěz testu aacPlus. Kodek ale nedosáhl kvality CD, k tomu byl zvukový obraz příliš neostrý. Prostorový vjem byl nedostatečný a zvuk vycházel z beden trochu tlumeně. Ale při takto nízkém bitrate dopadl zbytek testovaného pole ještě hůře. „CD kvalita“ při 48 kb/s je v současné době technicky zjevně nedosažitelná.


Nastavením kodéru OggVorbis na stupeň kvality nula získáte průměrný bitrate 64 kb/s.

Při 64 a 86 kb/s zvládá OggVorbis bravurně zejména tiché pasáže, ty jsou velmi podobné originálu. Ale teprve při 80 kb/s ukáže tento kodek svou sílu. OggVorbis je dimenzován na variabilní bitrate (VBR) a poskytuje v tomto režimu podstatně lepší výsledky než při konstantním bitrate (CBR), při kterém je dokonce nejpomalejším kodérem v testu. Soubory VBR vyrábí téměř dvakrát tak rychle. Problém u variabilního bitrate spočívá v tom, že v tomto režimu dodržuje kodér průměrný datový tok jen zřídka, takže žádané velikosti souboru se téměř nikdy přesně nedosáhne.

Jako další techniku podporuje kodér takzvaný „Channel Coupling“. Signály, které budou vycházet z obou kanálů stejně nebo podobně, zakóduje OggVorbis díky této technologii jen jednou. Tato metoda navíc šetří místo. OggVorbis je v komprimování vůbec dobrý: při stejném bitrate potřebuje kodér o trochu méně místa než ostatní účastníci testu.

Konfigurace kodéru je jednoduchá. Bude se ním dobře zacházet i začátečníkům, za předpokladu, že použijí správný nástroj. Optimálním je OggDrop (www.vorbis.com), u kterého se písně jednoduše přetahují na plochu. Všechna důležitá nastavení ke kodéru najde uživatel na jednom místě. Praktické je to, že při variabilním bitrate ukazuje OggDrop u stupně kvality, který se dá nastavit posouvátkem, i odpovídající bitrate. Tato služba není samozřejmá. U Windows Media Encoderu 9 ji například musíte složitě hledat.

 

Vynechat to, co nikdo nevnímá

Audiokodéry pracují podle sluchu

V každém audiokodéru je integrován model možností lidského sluchu (tzv. psychoakustický model). Podle tohoto modelu kodér určuje, které informace původní písně jsou nadbytečné, protože je lidské ucho vlastně vůbec nebere na vědomí. V grafu vidíte bíle označenou oblast, kterou může náš sluch ještě zachytit. Oblast, která se zpravidla používá pro řeč nebo pro poslech hudby, je značně menší.

Veličinou, jež určuje, jestli zvuk ještě vnímáme nebo ne, je vedle hlasitosti především frekvence. Šumy od frekvence zhruba 16 kHz nemůže dospělý člověk zpravidla vůbec vnímat. S přibývajícím stářím tento práh slyšitelnosti dále klesá. U malých dětí je proti tomu ještě na 20 kHz.

 

WMA9

Kodér od Microsoftu nabízí tři různé druhy komprimace. Komprimace beze ztrát dovoluje archivaci hudby při poloviční velikosti bez ztráty kvality. Normální Windows Media 9 (WM9) komprimuje v mono a stereo, zatímco WM9 Pro se používá při vícekanálovém výstupu.



Kodér Windows Media nabízí více režimů pro variabilní bitrate.

Rychlost Windows Media Encoderu 9 na Pentiu 4 je neuvěřitelná: čtyřminutovou píseň překonvertuje kodér ani ne za deset sekund. To znamená pro kompletní CD jen dvě minuty. Kvalita zvuku se dá shrnout do krátkého konstatování: U všech testovaných toků zní příliš tlumeně. Tento dojem odpovídá výsledku měření průběhu frekvence: WMA9 ořezává vysoké frekvence příliš brzo a s vysokým tóny má také problémy. Hlasité, intenzivní pasáže replikuje formát při nízkých bitrate jen nečistě, situace se zlepší teprve od 80 kb/s.

Kodér zanechává rozpačitý dojem, co se ergonomie týče. Na jedné straně nabízí mnoho možností nastavení, na druhé straně naráží uživatel stále na omezení. Tak například nemůže si svobodně vybrat bitrate, protože kodér pracuje jen s profily, ve kterých je datový tok fixní. Také když si chce uživatel založit profil s určitým bitrate, nemůže si ho sám určit. Nemohli jsme například komprimovat žádné skladby s 80 kb/s při variabilním bitrate – kodér tuto volbu nepřipouští.

Přitom právě v případě variabilního bitrate nabízí více než konkurence. Existují tři různé režimy, které si uživatel může nastavit. Vedle režimu „Kvalita“, který komprimuje všechny písně stejným poměrem, existuje ještě „Bitrate VBR“ pro nastavení průměrného toku. Při třetím režimu – „VBR nejvyšších hodnot“ – si uživatel může nastavit maximální hodnotu, kterou nesmí kodér překročit. Jako jediný software v testovaném poli má tento nástroj Microsoftu také dvouprůchodové (2-Pass) kódování, vlastnost, která pochází původně z oblasti komprimace videa. Ale i při konvertování audia to má smysl – kodér si při prvním průchodu proud zvuku analyzuje, aby při druhém optimalizoval rozdělení bitrate.

GoldWave 5.06

I když je Windows Media 9 proti předešlým verzím dobrý, dodržuje Microsoft striktní výrobní politiku: kdo si chce ze svého souboru Windows Media udělat nekomprimovaný WAV soubor, musí sáhnout po komerčním nástroji – nejlépe po GoldWave (www.goldwave.com).

Uživatelé si sice mohou vše konvertovat do WMA, ale ne z WMA do jiného formátu. Instalaci Goldwave 5.06 naleznete i na našem Chip CD.

 

mp3PRO

Vedle accPlus je mp3PRO druhým z testovaných kodérů, který zkouší vytvořit dobrý zvuk pomocí SBR při nízkém bitrate. U tohoto kodéru je metoda SBR koncipována podle technologie firmy Coding Technologies, použité u MP3 kodéru Fraunhofer. Ale s MP3 jako základem nemůže tento formát dosáhnout efektivity aacPlus.


Pro variabilní bitrate nabízí mp3PRO v Neru jen pět profilů.

Průběh frekvence ukazuje, že mp3PRO při 64 kb/s ještě pokryje skoro celou slyšitelnou oblast. Dokonce při frekvenční charakteristice ještě nižšího bitrate – 48 kb/s – neztrácí mp3PRO téměř nic ze své šíře. Poslechový test ale dává jiné svědectví, při 48 kb/s znějí výšky tlumeně – SBR již zjevně nefunguje zcela bezvadně. V Tokátě a fuze d moll od Johanna Sebastiana Bacha najednou zaznívají tóny, které nebyly v originále slyšet, jako by byly dekodérem špatně rekonstruované. I při 64 kb/s jsou výšky v Tokátě lehce zkreslené. Zato u popové písně Radio Orchid od skupiny Fury in the Slaughterhouse zanechal mp3PRO dobrý dojem. Teprve od 80 kb/s produkuje mp3PRO kvalitu blížící se kvalitě CD.

Vyhlídky jsou pro mp3PRO pochmurné: formát je tu již přes dva roky, ale z důvodu licenčních nákladů se téměř nemohl prosadit. Sice existují některé hardwarové přehrávače, které ovládají formát mp3PRO (www.mp3PROzone.com/products.htm), jsou to ale bohužel výjimky. U velkého počtu hardwarových přehrávačů zůstává formát mimo hru. Dnes již mp3PRO neznamená technologickou špičku pro nízké datové toky.

 

AAC

Za vývojem formátu vyhlášeného za následovníka MP3 stojí velká jména. Licence pro Advanced Audio Coding (AAC) mají AT&T, Dolby, Fraunhofer a Sony. Zavést technologii AAC tedy něco stojí, a nejedná se o málo peněz. Přehled licenčních poplatků najdete na http://www.vialicensing.com/products/mpeg4aac/license.terms.html. Mezitím se také plánuje AAC jako část specifikace MPEG-4 a tím jako standardní audiostopa pro soubory MP4. Formát má tak dvě opory – jak v oboru audio, tak také v oboru video.


Kodér AAC v Quicktimu dovolí při bitrate 48 kb/s vzorkovací frekvenci jen 32 kHz.

Prvním a doposud jediným velkým podnikem sázejícím plně na AAC je firma Apple. Společnost Apple vestavěla formát do svého multimediálního nástroje Quicktime 6 a prostřednictvím svého úspěšného on-line obchodu „i-Tunes“ nabízí hudbu ke stažení ve formě souborů AAC. Jako alternativa k původnímu MP3 funguje AAC dobře, protože zní při standardním bitrate 128 kb/s lépe. Ale jak bojuje tento formát s konkurencí na úrovni nízkého bitrate?

Ze dvou kodérů AAC, které trh nabízí pro koncové uživatele, jde v našem testu na start Quicktime Pro 6.3. U zkušebních poslechů ořezává produkt od Applu frekvence o něco lépe než kodér integrovaný v Neru 6. AAC v obou těchto programech dává najevo, že to není vhodný kandidát pro bitrate 64 kb/s. U Quicktimu jde kodér při 48 kb/s se vzorkovací frekvencí automaticky dolů, až na 32 kHz, a audio CD standard (44,1 kHz) vůbec nenabízí. Z měření průběhu frekvence je zřejmé, že při tomto bitrate kodér ořezává frekvence již na výšce těsně nad 10 kHz, tedy zjevně ještě ve slyšitelné oblasti. Při 64 kb/s se sice tato hodnota zvedá na 13,3 kHz, stejně je ale AAC v této kategorii na konci testovaných kodérů.

V poslechovém testu potvrdil AAC špatný dojem, který se projevil při analýze frekvenčního průběhu. Při nízkém bitrate není tento formát pro nikoho konkurencí. Při 48 kb/s kodek bez milosti ořezává vysoké tóny i intenzivní pasáže a tomu odpovídá i zkreslená hudba, která vychází z reproduktorů. Při 64 kb/s dodává AAC sice lepší kvalitu, ale v oblasti vysokého tónu nevzniká čistý zvukový obraz. Teprve od 80 kb/s dohání formát AAC ostatní a je blízko CD kvalitě.

Slovníček

Bitrate: Datový tok. Počet bitů, které kodér produkuje na svém výstupu za jednu sekundu.
Sampling Rate: Vzorkovací frekvence – počet snímání audiosignálu za jednotku času. CD přehrávač například snímá píseň 44 100krát za sekundu.
CBR (konstantní bitrate): Píseň je kódována konstantně s jedním bitrate. Kodér nebere ohled na kolísání objemu zvukových informací v písni.
VBR (variabilní bitrate): Kodér se řídí podle písně. V klidných místech šetří bitrate, který pak v intenzivních pasážích přidá.
ABR (průměrný bitrate): Píseň má průměrně nastavený bitrate, v písni je ale rozdělen různě.
SBR (Spectral Band Replication): Ukládání informací o vysokých frekvencích, které kodér standardně při komprimaci vynechá. Dekodér je rekonstruuje při přehrávání.

 

Závěr

Výsledek našeho testu překvapil. Ne proto, že je aacPlus vpředu – to se dalo na základě použité technologie předpokládat –, ale protože jediný účastník Open Source, Ogg Vorbis, tak dobře ořezává frekvence a skončil na druhém místě. To je v podstatě pořádná facka pro všechna velká jména, která se umístila až za AAC. A jak to vypadá s heslem „CD kvalita“ při nízkých bitrate? Test ukázal, že to není možné v oblasti 48 kb/s, tady nedostal žádný kodér dobrou známku. Teprve při 64 kb/s dostává špička pole s aacPlus a OggVorbis pečeť „CD kvalita“. Pro zbývající kodéry platí následující: Kdo nechce způsobit výraznou kvalitativní újmu proti originálu, musí sáhnout po vyšších bitrate, tedy minimálně po 80 kb/s.

Kdo má tedy největší šance vystřídat MP3, resp. být jeho obdobou při nízkých bitrate? Microsoft sice činí vše pro to, aby rozšířil svůj formát Windows Media mezi lidi, ale co se týče kvality, je to jen průměr. OggVorbis by měl navzdory Open Source dobré šance, ale výrobci hardwaru se nepřipojují. Lepší karty má aacPlus: i když hardware ještě chybí, jako část MPEG-4 standardu a na základě své vysoké efektivity při nízkých tocích je to pro počítačový průmysl zajímavý audioformát.

M. Mandau, Petr Zákostelný