Technologie k≤dovßnφ hudby a srovnßvacφ test softwarov²ch encodΘr∙ a p°ehrßvaΦ∙ MP3
Na malΘm mφst∞ hodn∞ muziky
Formßt pro uklßdßnφ audiodat MP3 pou₧φvß nebo o n∞m minimßln∞ slyÜel snad ka₧d². Jeho podstatou je Frauenhoferov²m institutem vyvinut² algoritmus, kter² komprimuje hudebnφ soubory v zßvislosti na v²slednΘ kvalit∞ na asi jednu desetinu jejich p∙vodnφ velikosti, a spl≥uje tak p°edpoklady pro internetovou v²m∞nu, p°enosnΘ p°ehrßvaΦe a mobily vyÜÜφ t°φdy.
Nenφ tedy divu, ₧e nez∙stalo jen u MP3 a formßty mp3PRO, OGG Vorbis nebo WMA cht∞jφ z tohoto kolßΦe takΘ n∞co ukousnout. N∞kterΘ tyto kodΘry komprimujφ jeÜt∞ efektivn∞ji a zn∞jφ dokonce jeÜt∞ lΘpe.
D∙vod, proΦ se t∞chto formßt∙ obßvß i mocn² hudebnφ pr∙mysl, je jasn² - logicky se mu nelφbφ, ₧e skladby, za kterΘ by se m∞lo platit, jsou tak snadno a bez jeho v∞domφ duplikovatelnΘ.
P°φjemnΘ je, ₧e vÜechny formßty fungujφ stßle s nejd∙le₧it∞jÜφmi softwarov²mi p°ehrßvaΦi, jako je nap°. Winamp - dekodΘry jsou integrovßny nebo instalovatelnΘ jako plug-iny. Pouze u hardwarov²ch p°ehrßvaΦ∙ je zapot°ebφ obez°etnosti, ne ka₧d² ovlßdß WMA nebo mp3PRO, OGG zatφm neumφ ₧ßdn².
D∙le₧it²m srovnßvacφm kritΘriem pro nßÜ test je komprese. Ale proto₧e rozdφly v tΘto kategorii jsou stßle menÜφ, byl pro nßs rozhodujφcφm hlediskem subjektivnφ poslechov² dojem, dopln∞n² mno₧stvφm nam∞°en²ch ·daj∙.
LAME 3.92
Opravdov² krßl mezi kodΘry, kterΘ vytvß°ejφ formßt MP3, mß jmΘno LAME. Frauenhofersk² originßl p°edstihne nejen v kvalit∞, ale i v konfigurovatelnosti - milovnφk hudby ho m∙₧e dokonale p°izp∙sobit sv²m pot°ebßm. Variabilnφ datov² tok (bitrate), Joint Stereo a propracovanΘ profily se starajφ o odpovφdajφcφ pom∞r mezi kvalitou a mφrou komprese.
Jak to, ₧e LAME nabφzφ o tolik vφce? Odpov∞∩ je stejn∞ tak jednoduchß jako pouΦnß a znφ - Open Source. Oproti frauenhoferskΘmu kodΘru stojφ za LAME celΘ spoleΦenstvφ v²vojß°∙, kterΘ ho neustßle vylepÜuje a vydßvß tΘm∞° pravideln∞, v₧dy za n∞kolik t²dn∙ novou verzi, kterß je zalo₧ena na optimalizovanΘm psychoakustickΘm modelu (viz rßmeΦek na str. 32).
Opravdu dobr² je LAME od verze 3.91. Umo₧≥uje k≤dovßnφ pomocφ profil∙ (Presets), kterΘ vyu₧φvajφ schopnostφ kodΘru a jsou ulehΦenφm hlavn∞ u variabilnφch bitrate. U₧ivatel m∙₧e dφky n∞mu nap°φklad nastavenφm "alt-preset standard" vytvo°it MP3 soubor o vysokΘ kvalit∞, ale p°esto tento soubor nenφ o mnoho v∞tÜφ ne₧ stejnß nahrßvka k≤dovanß na 128 kb/s. P°i tΘto metod∞ Üet°φ kodΘr bitrate na klidn²ch mφstech a p°idßvß ho u komplexnφch pasß₧φ. P°esto vÜak z∙stßvß LAME MP3 kodΘrem to znamenß, ₧e u nφzk²ch bitrate jako 64 kb/s nemilosrdn∞ o°ezßvß vysokΘ frekvence a zkresluje zvuk. Body ale sbφrß ve v∞rnosti originßlu p°i 128 kb/s. Tam u₧ musφ posluchaΦ nastra₧it uÜi, aby rozliÜil originßl a v²stup LAME.
Tip: LAME naleznete na Chip CD i jako ACM kodΘr, je tedy vyu₧iteln² i v jin²ch programech pro prßci se zvukem (nap°. Virtual Dub).
Microsoft WMA 8
NßÜ test ukßzal, ₧e WMA je podstatn∞ lepÜφ ne₧ jeho pov∞st nebo pov∞st jeho v²robce. Za Üpatn² image WMA si ale m∙₧e Microsoft sßm, proto₧e kdy₧ p°iÜel tento audioformßt na trh, neudr₧el krok s formßtem MP3. Navφc si Microsoft rozzlobil hudebnφ fanouÜky tφm, ₧e do WMA zabudoval Digital Rights Management (DRM) jako zp∙sob ochrany proti kopφrovßnφ - ten byl ale krßtce nato prolomen.
A₧ WMA kodΘr spl≥uje sliby Microsoftu vyprodukovat dobrou kvalitu i p°i bitrate 64 kb/s. CD kvality, kterou MP3 slibuje p°i 128 kb/s, ale WMA p°i poloviΦnφ bitrate nedosahuje. Zvuk se sice originßlu hodn∞ blφ₧φ, ale znφ trochu tlumen∞ a ztrßcφ svi₧nost. P°i 64 kb/s ale s kodΘrem mp3PRO lehce dr₧φ krok. Pokud tedy n∞kdo musφ nutn∞ Üet°it mφstem, pro toho je WMA tou pravou volbou. U tohoto nßstroje op∞t p°ichßzφ ke slovu firemnφ politika Microsoftu a k≤dovßnφ hudby pomocφ WMA je jednoduchΘ, profily pro standardnφ datovΘ toky jsou p°ednastaveny - zvlßdnou je tedy i zaΦßteΦnφci v oblasti k≤dovßnφ. ┌pln∞ jinak to vÜak vypadß, pokud chce u₧ivatel WMA soubor konvertovat do jinΘho formßtu - i kdy₧ t°eba jen do WAV. V tomto p°φpad∞ Microsoft nenabφzφ v∙bec nic a p°enechßvß pole p∙sobnosti sharewarov²m program∙m, jako nap°. Advanced WMA Workshop (www.litexmedia.com), kterΘ tyto slu₧by p°ejφmajφ.
Coding Technologies mp3PRO
Vß₧n² nedostatek MP3 spoΦφvß v tom, ₧e kvalita zvuku p°i 64 kb/s drasticky klesß. Prßv∞ tady navazuje mp3PRO: Coding Technologies vyvinula techniku nazvanou "Spectral Band Replication", zkrßcen∞ SBR. VylepÜen² kodek zachovßvß vysokΘ frekvence, tak₧e u₧ p°i 64 kb/s mß b²t dosa₧eno kvality CD. Ve skuteΦnosti to funguje tak, ₧e mp3PRO v²Üky sice o°ezßvß takΘ, ale p°i p°ehrßvßnφ je umφ znovu rekonstruovat. Jak ale kodΘr vφ, kterΘ frekvence zp∞tn∞ vylepÜit? Velice jednoduÜe: mp3PRO komprimuje nφzkΘ frekvence normßlnφm MP3 zp∙sobem a informace o vysok²ch frekvencφch uklßdß v oblasti hlubok²ch t≤n∙ (tedy op∞t nφzk²ch frekvencφ).
V poslechovΘm testu SBR technologie dokazuje, co umφ. Dobrß kvalita zvuku p°i 64 kb/s nßs p°esv∞dΦila o jeho v²hodßch, jen WMA se nßm zdßlo o n∞co mßlo v∞rn∞jÜφ originßlu. Od tvrzenφ "CD kvalita" p°i 64 kb/s jsme ale upustili. Tip: Pokud n∞kdo chce p°ehrßvat mp3PRO soubory v populßrnφm softwarovΘm MP3 p°ehrßvaΦi Winamp, m∞l by si nejprve nainstalovat odpovφdajφcφ plug-in od firmy Thomson. Jen ten toti₧ umo₧nφ opravdov² po₧itek z poslechu ( jin² MP3 dekodΘr p°ehraje tento formßt takΘ, ale bez v²hod mp3PRO) souboru k≤dovanΘho v tφmto zp∙sobem se vzorkovacφ frekvencφ 44,1 kHz. Plug-in najdete na adrese www.winamp.com. KodΘr mp3PRO je tΘ₧ k dispozici v CD vypalovacφm balφku Nero.
Frauenhofer MP3 Encoder
Originßlnφ kodΘr vykazuje prvnφ p°φznaky stßrnutφ a musφ v oblasti kvality zvuku p°enechat vedenφ programu LAME. A to i potΘ, co Frauenhofer∙v institut doplnil vlastnφ MP2Enc31 o FastEnc.
Spot°ebitelskΘ balφky jako MusicMatch, kterΘ sßzφ na Frauenhofer, vyu₧φvajφ v∞tÜinou oba kodΘry podle po₧adavku - vysok² bitrate (MP3Enc31) nebo vysokß rychlost (FastEnc).
V testu Chipu potvrdil Frauenhofer kodΘr bohu₧el svoji Üpatnou pov∞st, pokud se jednß o nφzkΘ datovΘ toky - p°i 64 kb/s v²Üky radikßln∞ o°ezßvß a v²sledek znφ jako z podzemφ. Konkurence nezachßzφ p°i tΘto komprimaci tak daleko a ponechßvß frekvence vyÜÜφ. Teprve p°i bitrate 128 kb/s a v²Üe poskytuje Frauenhofer sluÜnou kvalitu, i kdy₧ nedosahuje ani kvality programu LAME ani sφly zvuku programu OGG Vorbis.
P°i konfiguraci sice u₧ivatel m∙₧e dosßhnout p°es Joint Stereo a variabilnφ datovΘ toky optimßlnφho v²sledku, ale software, p°es kter² u₧ivatel kodΘr nastavuje, zpravidla u₧ nenφ freeware. Kdo chce do svΘho programu zabudovat Frauenhofer kodΘr, musφ platit - a sice asi 15 000 dolar∙ zßkladnφ poplatek a 0,50 a₧ 2,50 dolaru za ka₧d² prodan² produkt. To je cena, kterou v²robce dßle p°esouvß sm∞rem na spot°ebitele. D°φve za n∞j sice spot°ebitel ochotn∞ platil, proto₧e byl po dlouhou dobu, co se kvality t²Φe, zdaleka nejlepÜφ.
Blade Encoder 0.942
Pradßvn² Open Source kodΘr pat°φ u₧ v souΦasnΘ dob∞ spφÜe do muzea. P°i pohledu na pr∙b∞h frekvencφ je z°ejmΘ proΦ. Tam, kde ostatnφ kodΘry p°i 64 kb/s v²Üky jen o°ezßvajφ, provede Blade 0.942 neodpustitelnΘ v²°ezy, kterΘ se negativn∞ podepφÜφ na kvalit∞ zvuku.
Z bφlΘho Üumu (obsahuje vÜechny frekvence od 20 Hz do 20 kHz), kterΘ jsme v testu pou₧ili pro m∞°enφ pr∙b∞hu frekvencφ, ud∞lal Blade komprimßtor opot°ebovan² bφl² sk°φpot. VÜechny ostatnφ kodΘry zn∞jφ p°i tomto bitrate mnohem lΘpe.
Negativnφ dojem trval i p°i poslechovΘm testu zkuÜebnφ pφsn∞. P°i Üφ°ce pßsma 64 kb/s znφ Blade kodΘr zdaleka nejh∙°e. Kde ostatnφ hrajφ alespo≥ nap∙l p°irozen∞, tam to u Blade kodΘru v naÜich a₧ h°φÜn∞ drah²ch reproduktorech testovacφ soupravy chrastφ a drnΦφ. Ani nemluv∞ o p°φÜern²ch zkreslenφch v oblasti vysok²ch t≤n∙.
P°i 128 kb/s u₧ to vÜak vypadß o trochu lΘpe, co₧ se odrß₧φ takΘ v pr∙m∞rnΘm hodnocenφ "uspokojiv²", kterΘho Blade dosßhl i p°es svΘ umφst∞nφ a₧ na ·plnΘm konci. Zvukov² obraz je p°i tomto bitrate podstatn∞ vyvß₧en∞jÜφ. OznaΦenφ "tΘm∞° CD kvalita" jsme ale p°esto ud∞lit nemohli. Na zßv∞r nßm z∙stßvß poznatek, ₧e Blade s konkurencφ krok neudr₧φ.
T. Baur, M. Mandau, P. Zßkosteln²
Zßkladnφ pojmy
Bitrate (datov² tok) - poΦet bit∙, kterΘ jsou pou₧ity na jednu sekundu (komprimovanΘho) zßznamu.
Sampling rate (vzorkovacφ frekvence) - poΦet vzorkovßnφ, kter² provßdφ CD p°ehrßvaΦ za sekundu.
CBR (konstantnφ bitrate) - skladba je k≤dovßna konstantn∞ jednφm bitrate. KodΘr nezohled≥uje v²kyvy v pφsni. Soubor je v∞tÜinou v∞tÜφ ne₧ p°i VBR a u pasß₧φ s velk²m poΦtem hudebnφch informacφ neznφ tak dob°e.
VBR (variabilnφ bitrate) - kodΘr se °φdφ podle pφsn∞. U klidn²ch mφst bitrate Üet°φ, p°idßvß ho u intenzivn∞jÜφch partiφ. Kvalita je v∞tÜinou vyÜÜφ.
ABR (pr∙m∞rn² bitrate) - skladba mß v pr∙m∞ru nastaven² jeden bitrate, v²kyvy jsou ale v celΘ pφsni mo₧nΘ.
Jak jsme testovali
NaÜe testovacφ platforma sestßvala z PC Pentium III s taktovacφ frekvencφ 866 MHz, 128 MB RAM a Windows XP Professional. Pro poslechov² test jsme pou₧ili stereosoupravu se zesilovaΦem AVR-7000 od firmy Hartman/Kardon a reproduktory Tl10K od firmy JBL.
Kvalita
Subjektivnφ poslechovou kvalitu jsme testovali s n∞kolika hudebn∞ zkuÜen²mi jedinci.
Volby
KodΘry se liÜφ i v mo₧nostech nastavenφ. Hodn∞ bod∙ zde zφskß kodΘr, kter² mimo konstantnφho bitrate nabφzφ takΘ variabilnφ.
Software
KodΘry lze v∞tÜinou integrovat do r∙zn²ch ovlßdacφch ploch. Otestovali jsme, jak velkß je nabφdka takov²ch nßstroj∙ a kolik kter² stojφ.
M∞°enß data
U kodΘr∙ je d∙le₧it² vedle rychlosti transk≤dovßnφ takΘ stupe≥ komprimace. Koneckonc∙ cφlem je vyΦarovat i p°i vysokΘm stupni komprimace dobr² zvuk.
OGG Vorbis 1.0 Pre RC3 - vφt∞z testu
Open Source kodΘr nemß respekt ani p°ed Microsoftem ani p°ed Frauenhoferov²m institutem a louΦφ se s MP3.
Rychl², dobr² a zadarmo - tyto t°i atributy charakterizujφ u₧ v roce 1993 vyvinut² a na Open Source zalo₧en² kodΘr OGG Vorbis. Mφra rozÜφ°enφ je sice jeÜt∞ v²razn∞ ni₧Üφ, ne₧ je tomu u MP3, ale i p°esto se stßvß OGG ve stßle v∞tÜφ mφ°e mo₧nou alternativou. To je z°ejmΘ i z toho, ₧e u₧ krßtce po objevenφ na trhu byly k dispozici plug-iny pro Winamp, Sonique a FreeAmp. V nejnov∞jÜφ verzi Winampu 2.80 je OGG dokonce standardn∞ integrovßn.
Z oficißlnφch webov²ch strßnek je k dispozici jednoduch² kodΘr z p°φkazovΘho °ßdku a drag & drop aplikace, kterß ihned provßdφ p°evod vtßhnut²ch soubor∙. Velmi kvalitnφ a s mo₧nostφ nastavenφ zßkladnφch parametr∙ je i v²stupnφ plug-in do Winampu, kter² mφsto p°ehrßvßnφ uklßdß p°φmo OGG soubory.
V oblasti kvality zvuku boduje OGG na celΘ Φß°e. KodΘr komprimuje audiodata o n∞co vφce ne₧ MP3 kodΘr Frauenhoferova institutu, p°esto je kvalita zvuku p°i stejnΘ velikosti jednoznaΦn∞ lepÜφ.
P°i poslechovΘ zkouÜce obstßl OGG p°i 64 kb/s se znßmkou "uspokojiv²" - a i tak pat°φ k t∞m nejlepÜφm kodΘr∙m. Ostatn∞ hodnocenφ n∞kter²ch testovan²ch program∙ sahß a₧ k velmi ÜpatnΘ znßmce "nedostateΦn²" (Blade). Naproti tomu u OGG zn∞jφ testovanΘ skladby velmi dynamicky a hlasit∞, stejn∞ tak u 128 kb/s. I zde p°esv∞dΦφ freewarov² kodΘr celkov∞ vyvß₧en²m zvukov²m obrazem s Φir²mi v²Ükami a syt²mi basy.
CelkovΘ hodnocenφ 4/5
Cena/v²kon velmi dobr²
Cena freeware
Informace www.xiph.org
+ zdarma
+ dobr² zvuk
+ stßl² v²voj
- p°i 64 kb/s pr∙m∞rn² zvuk
TechnickΘ pozadφ
Postupy MP3 komprese
Aby bylo mo₧no vytvo°it z obrovsk²ch audiosoubor∙, kterΘ se nachßzejφ na CD, ·spornΘ MP3, OGG a WMA soubory, je zapot°ebφ pou₧φt specißlnφho postupu p°evßd∞nφ originßl∙. Ka₧d² z t∞chto postup∙ pracuje pomocφ komprimace, p°i nφ₧ dochßzφ ke ztrßt∞ velkΘho mno₧stvφ (pro lidskΘ ucho co nejmΘn∞ pot°ebn²ch) dat.
Na p°φkladu MP3 si ukß₧eme, jak kodΘry postupujφ. ZaΦφnß se rozd∞lenφm soubor∙ do fram∙, p°iΦem₧ ka₧d² frame obsahuje 26 milisekund. Jedna sekunda tedy obsahuje 38 fram∙. Ka₧d² frame mß zßhlavφ, kterΘ obsahuje zßkladnφ informace a jeho₧ velikost je 32 bit∙. Nφ₧e jsou t°i nejd∙le₧it∞jÜφ postupy komprimace, s nimi₧ kodΘr pracuje uvnit° ka₧dΘho framu.
Psychoakustick² model
Psychoakustick² model napodobuje lidsk² sluch matematicky a definuje jeho schopnosti vnφmßnφ (nap°. zvuky nad 16 kHz jsou pro Φlov∞ka s p°ib²vajφcφm v∞kem jen slab∞ nebo v∙bec slyÜitelnΘ). Mimoto ucho ze dvou po sob∞ jdoucφch t≤n∙ s podobnou barvou zvuku slyÜφ podrobn∞ jen ten hlasit∞jÜφ. Psychoakustick² model tyto lidskΘ slabiny znß, matematicky je definuje a shrnuje v²sledky do tabulek. P°i komprimaci porovnßvajφ kodΘry v²stupnφ signßl s tabulkou a o°ezßvajφ odpovφdajφcφ frekvence. Technickou v²zvou pro kodΘry je lΘpe p°izp∙sobit psychoakustick² model lidskΘmu sluchu.
Joint Stereo
Originßlnφ soubor: Joint Stereo vyu₧φvß tu skuteΦnost, ₧e na obou kanßlech Φasto b²vß stejn² signßl.
Komprimovan² soubor: Prav² kanßl obsahuje souΦet obou kanßl∙, lev² jen rozdφl. DekodΘr reprodukuje pozd∞ji signßl sprßvn∞ dek≤dovan².
Spojenφ bit∙
P°i p°ehrßvßnφ audiosignßlu CD p°ehrßvaΦem jsou digitßlnφ informace skladby zapisovßny do tzv. vzork∙. CD p°ehrßvaΦ se vzorkovacφ frekvencφ (sampling rate) 44,1 kHz vzorkuje CD za jednu sekundu 44,100x. To dßvß dohromady 1152 vzork∙ na jeden frame. Ka₧d² vzorek se sklßdß z urΦitΘho poΦtu bit∙, v p°φpad∞ 16bitovΘho k≤dovßnφ tedy ze 16 bit∙. Pokud tento bitov² vzor zaΦφnß hodnotami 000000, lze t∞chto Üest nul vynechat. Prost°ednictvφm informace v zßhlavφ vφ dekodΘr p°i p°ehrßvßnφ, ₧e z desetibitovΘho signßlu musφ vyΦarovat signßl 16bitov² dopln∞nφm chyb∞jφcφch bit∙.
┌spora mφsta - o°ezßnφ vysok²ch t≤n∙
U vysok²ch frekvencφ, kterΘ lidskΘ ucho m∙₧e sotva vnφmat, o°φznou kodΘry vÜechny informace, kterΘ obsahuje originßlnφ WAV.