Pro lidi, kteří se o mp3 zajímají více, bych něco málo doplnil.
Psychoakustický model - v normě MPEG jsou dva odlišné modely. První je použit pro kódování LayerI a II, druhý pak u Layer III. Psychoakustický model je složen z dvou hlavních úseků. Nejdříve je zvolen typ bloku, jež se použije během kódování a spočte se SMR (singnal to mask ratio).
Zvuk se převede z časové oblasti do frekvenční pomocí FFT (Fast Fourier Transform - rozložení amplitud na jendotlivé harmonické). Získaná data slouží pro výpočet prahů maskování. Výstup FFT je použit pro určení typu okna, které se použije během kódování. Dlouhé okno (long window), poskytující lepší frekvenční rozlišení, je použito pro statické signály. Naopak pro proměnné signály se použijí tři krátká okna (short window) s lepším časovým rozlišením. Následně jsou spočítány minimální prahy maskování, jež jsou použity pro výpočet SMR.
Různé typy encoderů používají různé psychoakustické modely.
Když už jsem se zmínil o tom maskování... V článku je zmíněno tzv. frekvenční makování (frequency masking), kdy např. méně intenzivní tón o frekvenci 7 200 Hz je maskován intenzivnějším (hlasitějším) tónem s frek. 7 000 Hz. (Frekvence nacházející se pod maskovecí úrovní (masking treshold) jsou maskovány a tudíž odstraněny z výsledného zvuku.)
A krom frekvenčního je zde ještě dočasné maskování (temporal masking) - toho je využito před o po silném zvuku. Je uplatněn, narozdíl od frekvenčního maskování, v časové oblasti. Pokud je zvuk maskován před silným zvukem, hovoříme o tzv. premaskingu. V případě maskování po silném zvuku se jedná o postmasking.
Taky vim, že lidské ucho nemá příliš dobrou schopnost pro lokalizaci zdroje zvuku v prostoru. Dokonce velmi hluboké a vysoké zdroje frekvence není člověk schopen lokalizovat vůbec. Ovšem netuším, zda je toho v mp3 využito. Možná je to součástí Joint sterea. Ví někdo jak to je?
A ještě jedna zajímavost. Lidské ucho vnímá zvuk logaritmicky. K tomu, aby člověk slyšel zvuk dvakrát hlasitěji, je potřeba navýšit jeho intenzitu desetinásobně. Navíc vnímání intenzity zvuku je závislé na frekvenci (s největší intenzitou jsou vnímámy zvuky ve frekvenčím rozsahu 1 - 5 kHz).