F.A.Q. MP3



Che cosa e' in breve lo standard MP3?
Lo standard MP3 e' in poche parole un algoritmo che implementa moderne tecniche di percezione sonora dell'apparato uditivo umano per raggiungere una elevata compressione dei dati senza una percettibile perdita di qualita'.

Qual'e' il problema che ha reso necessaria la creazione del formato audio MP3?
La musica e i segnali audio in generale sono molto ricchi di informazioni; per riuscire a mantenere intatte le piu' piccole sfumature di un suono e per conservarne la purezza, servono supporti audio digitali dotati di una notevole tecnologia.

Fammi un esempio!
Se scegliessimo di campionare 1 minuto di musica in qualita' CD ( 44.1 kHz - 16 bit - stereo), quanto occuperebbe su un computer senza nessuna compressione? Circa 10 Mbyte di memoria! ( Per un album intero, diciamo di 50 minuti, servirebbero piu' di 500 megabytes! )
Ok ho il mio minuto di musica sul mio computer... e se volessi ora trasferirlo tramite internet ad un amico per farglielo ascoltare?

Utilizzando un comune modem a 28.8 kbps ci metterei, nella migliore delle ipotesi, circa 1 ora! Tutto questo tempo solo per 1 minuto di musica, figuriamoci per un intero album! Ecco che quindi i costi in termini di memoria, bolletta telefonica e tempo speso cominciano a diventare un po' proibitivi.

La soluzione e' l'algoritmo MP3!

Per che cosa sta la sigla MP3?
Sta per MPEG 1 layer III.

Chi ha studiato lo standard MP3?
Lo standard e' stato studiato dall'MPEG (Moving Picture Experts Group), il gruppo di esperti per le immagini in movimento, che e' stato istituito con il compito stabilire la sintassi e i metodi di compressione per audio e video a basso bitrate (bit/secondo), per riuscire cioe' a comprimere cosi' tanto da permettere l'invio dei dati su canali di trasmissione molto lenti.

Quanto riesce a comprimere l'algoritmo MP3?
L'algoritmo layer III (MP3) e' attualmente il piu' potente dei 3 algoritmi ( layer I, layer II, layer III) inseriti nello standard MPEG e riesce a raggiungere rapporti di compressione elevatissimi senza variare la qualita' del suono.

Fammi un esempio!
L'algoritmo MP3 riesce a comprimere un brano musicale fino a 12 volte, permettendo ad esempio di inserire su un comune CD-ROM fino a 10 ore di musica in qualita' CD!

Ma come fa questo algoritmo a raggiungere tali livelli di compressione?
La spiegazione e' duplice; in primo luogo, l'algoritmo di compressione MP3 e' stato disegnato appositamente per gestire file audio, che hanno determinate caratteristiche statistiche; infatti e' possibile trovare in un brano musicale una certa correlazione piu' o meno marcata tra campioni adiacenti, sintomo di una ridondanza statistica; questa ridondanza puo' essere tranquillamente tolta utilizzando particolari codifiche ( predizione lineare, codifica entropica come la codifica di Huffman, unione dei frame) che, senza modificare il segnale audio, permettono di ottenere una prima diminuzione delle dimensioni del file di circa 2:1.

Ad esempio una funzionalita' dell'algoritmo MPEG che sfrutta proprio questo concetto per ottimizzare la codifica di segnali audio stereo e' la cosiddetta codifica di tipo "joint-stereo", che cioe' sfrutta le similitudini ( correlazioni) tra i 2 canali audio ( destro e sinistro) per riuscire ad ottenere una compressione molto piu' efficace.

In questo modo non si perde comunque nessuna informazione ( gli algoritmi appena visti vengono detti "lossless" cioe' senza perdita); con un algoritmo inverso risulta poi possibile ritornare al segnale originario.

Utilizzando pero' solamente queste tecniche, non si riuscirebbe in nessun modo a raggiungere le spinte compressioni effettuate dal formato MP3.

La potenza degli algoritmi MPEG di compressione audio infatti e' determinata principalmente dall'utilizzo contemporaneo di altri metodi di codifica, che applicano, a differenza di quelli appena visti, una compressione detta "lossy" cioe' "con perdita" di dati.

"Perche' allora quando ascolto un file MP3 non sento alcuna differenza rispetto al file ascoltato direttamente da CD?"
Perche' l'algoritmo e' molto "furbo" e calcola, mediante precise tabelle su cui e' descritta la percezione del sistema uditivo umano, le parti di informazione audio che, seppur presenti, non vengono fisicamente percepite dall'orecchio. In questo modo non riusciro' piu' a ricostruire perfettamente il segnale originario, ma, nell'ascoltarlo, non notero' alcuna differenza, perche' ho tolto solamente dei segnali inutili.

Questa codifica con perdita si basa sul fatto che l'orecchio umano non e' il migliore dispositivo per la ricezione di onde acustiche e quindi di segnali audio.

Prima di tutto un dispositivo non-lineare come l'orecchio umano ha la caratteristica di trattare le frequenze audio che riceve in maniera diversa le une dalle altre, dando piu' importanza ad alcune e meno ad altre ( queste ultime quindi non risultano molto utili!).

In secondo luogo l'orecchio umano ha una soglia di udibilita', cioe' un livello minimo sotto il quale un suono non e' percepito. Questa soglia di udibilita' e' anche adattativa, nel senso che viene costantemente cambiata dai suoni percepiti.

Per esempio, una normale conversazione in una stanza e' perfettamente udibile in condizioni normali; ma se durante la piacevole chiaccherata si aggiunge un rumore molto forte, come potrebbe essere il passaggio di un aereo, la conversazione non risulta piu' udibile, perche' le soglie di udibilita' delle 2 persone sono state distorte. Al termine del passaggio dell'aereo le soglie di udibilita' ritornano ai loro valori normali. I suoni che non risultano udibili a causa dell'adattamento dinamico della soglia di udibilita' vengono detti "mascherati".

Questo effetto si riscontra in particolar modo nella musica: una orchestra che stesse suonando una partitura con volume elevato, farebbe risultare le parti di alcuni singoli strumenti non udibili dall'orecchio di un ascoltatore. Quando la musica viene registrata ( ad esempio su di un CD), comunque, a causa della risposta uniforme ( cioe' non adattativa) del dispositivo di registrazione, tutte le frequenze indistintamente finiscono sul supporto audio.

Quando la musica viene riprodotta, pero', gli strumenti mascherati non saranno udibili all'orecchio dell'ascoltatore, e quindi e' come se non ci fossero. Per questo motivo le parti del mezzo di registrazione che contengono dati non udibili potrebbero invece essere utilizzate per contenere dati che al contrario sono udibili; cosi' posso ridurre considerevolmente lo spazio che mi serve per memorizzare informazioni audio, senza alcuna perdita nella qualita' della registrazione.

Che tecnologia serve per tradurre brani musicali in formato MP3?
Al giorno d'oggi e' una cosa accessibile a tutti. Basta possedere un computer ( va bene anche un PC 486) e una scheda sonora; in rete si possono facilmente trovare tutti i programmi necessari.

Posso ascoltare gli MP3 con un comune CD player?
No. Attualmente il formato MP3 non e' ancora supportato dai CD player; per ascoltare un CD-ROM di MP3 ho bisogno di un computer; ma stanno nascendo molti nuovi supporti audio che permetteranno di sfruttare tale tecnologia: walkman, autoradio, hi-fi...

Esistono altri formati audio piu' efficienti dell'MP3?
Si'. C'e' ne sono alcuni, tra cui l'MPEG2-AAC, ma il problema piu' grande e' che non sono compatibili con le vecchie versioni dell'algoritmo MPEG; in piu' presentano una maggiore complessita' e quindi maggiori costi nell'implementazione dell'algoritmo stesso.

Compatibilita'? Vuol dire che l'algoritmo MP3 e' gia' usato per applicazioni commerciali?
La tecnologia MP3 ( o compatibile) e' gia' presente in molti supporti audio e video come il DCC (Digital Compact Cassette), il DAB ( la nuova radio digitale), i DVD (Digital Video Disk) ed in molte altre applicazioni dove e' essenziale occupare il minor spazio possibile, mantenendo pero' intatta la qualita'.

Cosa mi dici della pirateria musicale che sfrutta il formato Mp3?
Niente paura, il formato audio MP3 e' legale, anzi e' uno dei pilastri fondamentali su cui si basera' il futuro del mercato musicale e delle telecomunicazioni; siete quindi liberi di utilizzarlo per crearvi compilation personali, per diffondere la vostra musica su internet o per qualsiasi utilizzo che ritenete opportuno; quello che non e' legale e' l'utilizzo del formato per fini di lucro, perche' lede i diritti degli autori e degli editori musicali; per questi casi e' necessario l'esclusivo permesso da parte della SIAE, che viene naturalmente concesso in seguito al versamento di un congruo compenso pecuniario.



Speciale MP3, argomenti trattati:

Il formato MP3
> Audio e computers
> La nascita del formato mp3
> Trucchi e segreti degli mp3

L'hardware
> i lettori MP3 (2001)

Diritto d'autore
> Problemi legati al diritto d'autore
> Che cosa fa la SIAE per voi?
> Non solo SIAE per proteggere la propria musica

Appunti, spunti, commenti
> MP3, Legalità, Siae, Cd-Rom compilation... ecc. ecc.

Per chi ha fretta
> Le domande piu' frequenti (FAQ)
> Mini FAQ per chi ha molta fretta...

---
L'articolo F.A.Q. MP3 di Camillo è apparso su Rockit.it il 2000-12-11 00:00:00

COMMENTI

Aggiungi un commento Cita l'autore avvisami se ci sono nuovi messaggi in questa discussione Invia