Accordo: Back to Basic: i formati dei file nell’audio professionale

Il file Wave

Partiamo dal formato Wav o Wave (e l’equivalente Aiff utilizzato da Apple) formato audio non compresso di cui dobbiamo tenere in conto 2 valori fondamentali:
il numero di bit e la frequenza di compionamento.

Il Bit Depth o numero di bit è la quantità di bit utilizzati per descrivere il valore di ampiezza di ogni campione. Il cd audio utilizza dati a 16 bit, il che corrisponde a 65.536 possibili valori per ogni campione. Con un bit depth di 24 bit abbiamo invece 16.777.216 valori possibili. Il numero di bit definisce anche la dinamica massima ottenibile, cioè la differenza tra il volume massimo e il rumore di fondo. Ogni bit abbiamo un valore teorico di 6 dB di dinamica, con 16 bit quindi possiamo ottenere fino a 96 dB di dinamica. Con 24 bit potremmo in teoria ottenere 144 dB di dinamica, ma la circuitazione allo stato dell’arte attuale permeate al massimo di arrivare intorno ai 120 dB di rapporto segnale/rumore.

La frequenza di campionamento o Sample Rate definisce la frequenza massima riproducibile. Secondo il teorema di Nyquist-Shannon la massima frequenza udibile corrisponde alla metà della frequenza di campionamento, per cui un normale CD audio, che utilizza un sample rate di 44.100 Hz, può riprodurre fino a 22.050 Hz, ben al di sopra della frequenza udibile dall’orecchio umano (da 20 Hz a 20.000 Hz).

Perché allora vengono utilizzati valori di Sample Rate maggiori se già con 44.100 Hz siamo sopra l’udibile umano? Il problema sta nel fatto che bisogna eliminare tutto ciò che sta sopra alla metà della frequenza di campionamento attraverso un filtro Low Pass analogico, prima di procedere al campionamento vero e proprio, altrimenti ci ritroveremo delle frequenze non presenti nel segnale originale (dette Alias), dovute ad un errore di interpretazione da parte del convertitore analogico-digitale (effetto di Aliasing). Dalla bontà di questo filtro dipende l’effettiva qualità della conversione e la quantità di errori introdotti. Semplificando poi, più alziamo la frequenza di campionamento e più spostiamo gli Alias prodotti fuori dallo spettro udibile umano. Questo però comporta una maggiore richiesta di risorse, intese come spazio fisico occupato all’interno dei nostri Hard Disk e utilizzo della CPU in caso di elaborazione del segnale.

I valori più utilizzati di Sample Rate e Bit Depth per i file Wave sono:

44.100 Hz / 16 Bit : il classico formato del CD audio.
44.100 Hz / 24 Bit : il formato base oggi utilizzato per registrare e mixare.
48.000 Hz / 24 Bit : frequenza di campionamento dell’audio utilizzata nella registrazione video.
88.200 Hz / 24 Bit : è il doppio di 44.100 Hz, miglior qualità e facile da ridurre a 44.100 Hz dimezzando i dati.
96.000 Hz / 24 Bit : è il doppio di 48.000 Hz, miglior qualità e facile da ridurre a 48 KHz dimezzando i dati.
192.000 Hz / 24 Bit : è oggi il valore più alto utilizzabile dalla maggior parte dei convertitori e programmi di elaborazione del segnale.

32 o 64 Bit sono utilizzati solo per elaborazioni interne alle DAW in quanto nessun convertitore è oggi in grado di utilizzare tale formato.

Ogni cambio di formato all’interno del computer richiede un calcolo matematico e non un ricampionamento dal segnale elettrico, che può introdurre errori, minimi nel caso in cui si passi ad esempio da 96KHz a 48KHz, perché semplicemente si dimezzano i dati, mentre ben maggiori quando si passa ad un sample rate maggiore o diverso, dove i dati aggiunti vengono creati attraverso algoritmi predittivi.

Il formato MP3

L’ MP3 che tutti noi ormai conosciamo e utilizziamo è un formato audio compresso che riduce sensibilmente il valore dei dati presenti nel file, attraverso degli algoritmi che lavorano sia sulla riduzione della banda audio riprodotta, che sulla quantità di campioni.

In genere viene utilizzato per la diffusione e lo scambio di file audio sulla rete e mai per l’elaborazione del segnale. Importando un file MP3 all’interno di una qualsiasi DAW viene sempre convertito in Wave prima di essere elaborato.

Come avrete sicuramente visto, anche nella produzione di file MP3 abbiamo un valore che definisce la qualità effettiva del file audio. Oggi che ci troviamo sempre più a ragionare in termini di Giga, se non di Terabyte, non c’è alcun motivo di utilizzare file MP3 con una codifica inferiore a 320kbit/s.
Al di sotto di questo valore vengono introdotti artefatti che portano ad una degradazione del segnale troppo grave per chi si occupa di audio professionale.

Gli altri formati

AAC è il formato utilizzato da Apple per iTunes ed è considerato il successore dell’ MP3, ora sostituito dall’ Apple Lossless, più comunemente chiamato M4A, compressione lossless, cioè senza perdita di dati, dove il file originale viene “ricostruito” dalla CPU prima di essere riprodotto. Per il momento, e forse mai, verrà utilizzato all’interno di una DAW, anche per il maggior utilizzo di potenza di calcolo del computer. Altri formati lossless utilizzati nell’audio sono il FLAC e l’ OGG (quest'ultimo è più precisamente un formato “contenitore” che può avere al suo interno diversi tipi di file al suo interno, sia lossy che lossless come il FLAC).

Il formato del futuro sembra essere per ora il DSD, che utilizza una tecnologia di campionamento creata da Sony e Philips (i padri del CD audio) per il oro Super Audio CD (SACD), con performance sonore sulla carta ben al di sopra degli standard attuali. Per il momento sono ancora molto poche le macchine e le DAW che supportano questo formato, a causa della dispendiosa quantità di spazio occupato e potenza di calcolo richiesta. Quanti anni ci vorranno ancora perché diventi il nuovo standard?