Heli bittideks ja bitid pressi alla
Leo Backman, Glen Pilvre
03.08.2009

Kui kaheksakümnendate keskel trügis vinüülplaadi asemele uut helikvaliteeti pakkuv CD, siis vaevalt keegi arvas, et CD tulevased konkurendid ründavad hoopis teise relvaga. Digiajastuga koos saabus ka mõiste „kadudega pakkimine” – vaatame lähemalt tänaste kokkupressitud muusikapalade kõhtu.

Ühe suure ja nimeka plaadifirma koosviibimisel – kus paljud töötajad olid koos teismeliste lastega – tehti väike eksperiment. Lauale olid kuhjatud erinevate artistide CD-albumid ja lastele öeldi, et võtke, mida vaid tahate. Noorem generatsioon olevat plaadivirna üsna nõutult takseerinud ning sellega asi piirdus – plaatidega polevat lihtsalt midagi teha, oli nende arvamus. Tõepoolest, taskupleierisse CD-plaat ei mahu. Netis liikuva muusika kogus on kaugelt suurem kui CDde hulk ja plaadifirmad tõsiselt hädas järjest kahanevate müüginumbritega. Ja näib, et noori ei heiduta üldse fakt, et netis liikuv muusika jääb CD omale kvaliteedi poolest alla. Kurja juur on kaasaegse multimeedia võtmesõna ehk kadudega pakkimine – see tähendab andmevoo olulist kiiruse vähendamist (suhteliselt väikese) kvaliteedilanguse arvelt.
Kolm suurt
Kadudega pakkimist kasutatakse täna praktiliselt kõikjal. Nii DVDdel, Blu-ray-plaatidel, digi-TVs, mobiilides – rääkimata muidugi taskupleieritest. Tavalise CD-plaadi maht on 700 megabaiti, kuid pakkimata heliminuteid on sel ainult 80 – lihtne arvutus näitab, et üks minut hõlmab 8,75 MB. Paarkümmend aastat tagasi oli iga bait kullahinnaga ja nii tegeldi aktiivselt parima võimaliku mahu ja kvaliteedi suhte väljatöötamisega. Sellest ajast pärinebki tuntuim helipakkimis-standard MP3 ehk MPEG-1 Audio Layer 3. Standardi loojaks oli rahvusvaheline ühendus nimega Moving Picture Experts Group ning MPEG-1 selle koosluse esimene töövõit – eesmärk vähendada eelkõige digitaalse videomeedia infomahtu erinevates kanalites. Pildi osas on MPEG-standard tänaseks jõudnud juba neljanda versioonini, kuid MPEG-1 kunagine audioformaat MP3 on endiselt väga elujõuline. Kui CD-l oleva pakkimata heli andmevookiirus on 1411 kbps, siis MP3 võimaldab hakkama saada kiirustega 32–320 kbps. Hea kvaliteedi huvides peaks MP3 bitivoog olema siiski 100st kbps-ist suurem. Nagu öeldud, on tegemist kadudega pakkimisega (lisaks kadudega pakkimisele on võimalik ka kadudeta pakkimine – seda teemat siin artiklis ei puudutata) ning mida väiksem on andmevoo kiirus, seda kuuldavamalt kvaliteet langeb. Palju sõltub MP3-enkooderist – ehk sellest, milliste algoritmide alusel pakkimine toimub. See, palju kvaliteet pakkimise käigus langeb, sõltub veel pakitavast kõlapildist – mida rohkem kõrgeid sagedusi ja dünaamikat selles spektris, seda kuuldavamaks muutuvad artefaktid. Ka mängib olulist rolli enkoodri kvaliteet – MPEG-standard sätestab vaid selle, millist faili peab dekooder suutma taasesitada, jättes pakkimise sisulise külje osas küllalt vabad käed pakkijale. Nii on enkoodrite algoritmide valik mitmekesine ja tõenäoliselt parimaks MP3-pakkijaks on Fraunhoferi instituudi patenditud algoritm (mille litsentsitasu on ka suurim). MP3 täiendatud versioonina loodi MP3 Pro, kuid see pole massilist kasutamist saavutanud.
Aastatuhande vahetusel esitles MPE Grupp MP3 uut versiooni AAC ehk Advanced Audio Codec. AAC on kasutusel MPEG-2 ja MPEG-4 vormingus video heliridade pakkimisel ning tal on MP3 ees palju eeliseid. Näiteks 128 kbps AAC fail kõlab märgatavalt paremini kui sama tihedusega MP3 oma, samuti nõuab AACks enkodeerimine vähem protsessorirammu. Sellegipoolest – endiselt nimetatakse kas või iPodi MP3-pleieriks, olgugi et Apple on põline AAC-lane. AAC rajale on täna siirdunud paljud seadmete tootjad – näiteks Sony, Nintendo, Nokia, Sony Ericsson jt. Ka on AACst arendatud veelgi tõhusamaid sugulasi, nagu AAC Plus, ning sellest omakorda HE AAC (High Efficiency AAC).
Kuid olemas on veel üks suur tarkvaragigant, kes leiutab kõik jalgrattad ise – või vähemalt väidab nii tegevat. See on loomulikult Microsoft, kes alates aastast 1999 ajab visalt oma rida WMA-nimelise standardiga. Kvaliteedilt on uusim WMA (Windows Media Audio) enam-vähem AACga samas liigas, ehk teoreetiliselt parem kui sama bitikiirusega MP3. Tänaseks on WMAga „leppinud” enamik seadmete tootjad, kuid mitte Apple – iPodid-iPhone’id WMAd ei tunnista, samas Microsofti taskupleier Zune on AACde vastu sõbralikum. Ka WMAst on Microsoft esitlenud mitmeid versioone. Täiuslikem neist on WMA 10 Pro ning firma teeb pingutusi, et Pro headust veenvalt tõestada. Näiteks mõned aastad tagasi tellis Microsoft NTSLilt (National Software Testing Lab) HE AAC ja WMA Pro võrdluse ning napilt osutuski paremaks viimane. Umbes pooled testkuulajad ei osanud küll ühte teisele eelistada, aga nende protsendi liitis Microsoft kavalalt WMA Pro pooldajate omaga (mis oli tõesti marginaalselt suurem) ning väitis, et saadud summaarne protsent pidas võrdseks või eelistas HE AACle WMA Prod J.
Lisaks MP3-le, AAC-le ja WMA-le on vähem liikvel veel Real Networksi kasutatav formaat RealAudio (faililaiendid RA ja RAM) ning vabavaraline OGG VORBIS.
Küberneetilised tehnoloogiad
AAC kodeeringuga on võimalik ühitada ka PNS (Perceptual Noise Substitution) algoritmid. See tähendab, et juba enkodeerimisel eraldatakse helisignaalist müra ning selle edastamiseks väärtuslikke bitte ei kulutata. Aga et tihtipeale võib ka müra olla helipildi oluline osa (kas või akustiliste salvestuste puhul), siis päris ära ei saa seda ka visata. Lihtsustatult võib öelda, et PNS-tehnoloogia abil loob AAC-enkooder mürale vastavad profiilid ning „pakib” need failiga kaasa. Kui sellist faili mängib maha PNS-mürageneraatoriga AAC-dekooder, siis oskab see vastavalt müraprofiilidele luua samalaadse müra faili taasesitusel.
Parameetrid ja struktuurid
Kui näiteks spektraalset kodeeringut kasutava MP3 puhul räägitakse pakkimiskoefitsiendist 1 : 11 (et kuulatava kvaliteet vähegi säiliks), siis parameetrilise kodeeringu puhul on see suhe 1 : 80 – ehk väidetavalt peaks hifi-heli jaoks piisama andmevoost kiirusega 15–20 kbps (samas suurusjärgus on praegu GSMi kõnepakkimise infovoog). Parameetriline enkooder aimab järgi inimese kuulmisaistingut, eraldades helitud ja helilised komponendid üksteisest ning analüüsides ka seda, kuidas helisid on mõjutanud nende tekkekeskkond. Heli „algosad” jagatakse kolme põhirühma: puhtad nn siinusvõnked, nende harmoonilised ning juhuslikud signaalid (nagu müra, mille enkodeerimisest oli eespool juttu). Nii ei sisalda parameetriliselt enkodeeritud helifail enam bittide kujul olevaid helisid, vaid algse helipildi põhjal loodud käske helide tekitamiseks. Dekoodris juhivad need käsud heligeneraatoreid, mis taasesitavad algse heli. Kuna taasesitatav heli luuakse sajaprotsendiliselt uuesti, siis on dekodeerimisel kerge muuta helipildi olemust vastavalt vajadusele, või näiteks selle kiirust või kõrgust teineteisest sõltumatult.
Sammu kübersuunas astub SAC ehk Structured Audio Coding. Heli modelleeritakse pakkimisel täielikult „heliplokkideks” (iga „tükk” saab oma unikaalse koodi) ning taasesitamisel sünteesitakse nende plokkide baasil uuesti. Siinkohal võib paralleeli tõmmata MIDI-kodeeringuga, milles samuti heli asemel liigub digi-info nootide, nende pikkuste ja kõrguste kohta. SACi puhul olevat reaalne edastada hifi-tasemel heli bitikiirusega umbes 3 kbps (30–100 korda vähem praeguste formaatide kiirustest) – see tähendab, et ühele CDle mahuks taoliselt kodeeritud muusikat umbes 627 tundi!
Ometi – nii nagu vähenevad mahud uute pakkimistehnoloogiatega lõpptarbija jaoks, suurenevad need hoopiski professionaalses audiomaailmas. Sama kvantiteedi-kvaliteedi „paradoks” vaatab vastu kõikjalt – võimalikud resolutsioonid-megapikslid-mälumahud kihutavad ülesmäge, kuid (laia)tarbitakse enamikku materjalist vaat et nigelama kvaliteediga kui seda võimaldab kas või eelmise sajandi keskpaigast pärit PAL-telestandard. Igatahes oleks kuidagi kurb, kui sümfooniaorkestrit salvestataks tulevikus ülima kvaliteedi huvides näiteks bitikiirusega 5644 kbps, kuid kuulajani jõuab suurvorm 3 kbps muusikakonservina – mis pole aga üldse võimatu.

Artikli märksõnad: 

Sarnased artiklid