VINTAGE VAULT SHG MUSIC SHOW PEOPLE STORE
Campionamento e Quantizzazione
Campionamento e Quantizzazione
di [user #33262] - pubblicato il

Nel precedente articolo abbiamo approfondito il concetto di Frequenza di campionamento descrivendone le proprietà e implicazioni. Fatto questo, proseguiamo nella descrizione del circuito schematizzato nell'articolo introduttivo e vediamo cosa accade a ogni istante (in numero, per ogni secondo, pari alla frequenza di campionamento definita) in cui il nostro convertitore si appresta a scattare una fotografia del segnale in ingresso.
Nel precedente articolo abbiamo approfondito il concetto di Frequenza di campionamento descrivendone le proprietà e implicazioni. Fatto questo, proseguiamo nella descrizione del circuito schematizzato nell'articolo introduttivo e vediamo cosa accade a ogni istante (in numero, per ogni secondo, pari alla frequenza di campionamento definita) in cui il nostro convertitore si appresta a scattare una fotografia del segnale in ingresso.

Questo è il momento in cui entra in azione il circuito di Sample & Hold che memorizza il valore di tensione del segnale nell’istante in cui questo deve essere campionato (Sample) e lo mantiene (Hold) costante (il circuito resta chiuso) fino al momento in cui, in base alla frequenza di campionamento impostata, deve misurare il valore di tensione del campione successivo (il circuito si ri-apre).

Il preciso alternarsi tra l’apertura e la chiusura del circuito è regolato, come si vede nella rapida schematizzazione apparsa nel prologo, dal segnale di “clock” che, semplificando molto e omettendo qualche implicazione “fisica”, consiste in una precisissima onda quadra che scorre a lato del circuito atto al campionamento del segnale e pulsa in accordo alla frequenza di campionamento selezionata.

Beh, anche qui fosse tutto così semplice non ci sarebbe troppo da divertirsi, e infatti ora inizia il difficile.

Prendiamo un segnale semplice (un’onda sinusoidale – sine wave – a frequenza e ampiezza fisse) che supponiamo compia il suo ciclo in un secondo esatto (un’onda quindi con frequenza pari ad 1 Hz – inudibile all’essere umano, ma tanto utile per schematizzare il nostro lavoro) e immaginiamo di campionarla a una frequenza di 10 Hz (la nostra frequenza di campionamento sarà, manco a dirlo, pari a 10 Hz). Le linee tratteggiate verticali evidenziamo gli istanti in cui l’onda sarà campionata mentre il valore di tensione (asse Y) rilevato, evidenziato dai pallini rossi, è quello che sarà mantenuto costante nel circuito di hold per ogni frazione di secondo.

Campionamento e Quantizzazione

E ora viene il bello. Questo valore di tensione, un valore analogico e quindi continuo nei valori che può assumere, deve essere trasformato in valore digitale, usufruibile da parte del nostro calcolatore e quindi espresso con un numero binario. I valori a disposizione non sono infiniti e infatti le non infinite capacità di calcolo delle nostre macchine impongono un limite al numero di valori possibili che possiamo assegnare.  Introduciamo il concetto di risoluzione (“bit depth”, in inglese), ovvero il numero di bit che il sistema mette a disposizione per descrivere il valore di ogni campione all’interno del nostro circuito di campionamento.

Sarebbe interessante (anche se non per tutti, mi rendo conto) una bella lezioncina di aritmetica binaria, ma direi che non è esattamente il nostro obiettivo, quindi saltiamo tutti i preliminari (applausi a scena aperta…) e prendiamo per partito preso quanto espresso nella tabella seguente.

Campionamento e Quantizzazione
L’interpretazione è semplice: il numero di valori rappresentabili in sistema binario si ottiene elevando il numero di valori assegnabili a ciascuna posizione (due, ovvero “0” e “1” che corrispondono a un circuito aperto o chiuso) per il numero di “posizioni” (i bit, appunto) disponibili.

La trasformazione del valore di tensione misurato in valore digitale, la quantizzazione, avviene a cura del circuito di Quantize all’interno del quale il valore di tensione viene approssimato al più vicino dei valori disponibili, a seconda quindi della risoluzione in bit alla quale avviene il processo di conversione. Sempre semplificando un tantino, le immagini successive vi mostrano la stessa sine wave di poco fa con la sovrapposizione di una serie di informazioni:

a) Sovrapposta in verde, la ricostruzione dell’onda di cui sopra, dopo il processo di approssimazione ai valori disponibili (linee tratteggiate orizzontali) negli istanti in cui avviene il campionamento (linee tratteggiate verticali).

Campionamento e Quantizzazione


b) La stessa sine wave campionata alla stessa frequenza, a una risoluzione tripla rispetto alla precedente. Aumenta la densità delle linee orizzontali, quindi migliora l’approssimazione dei valori assegnati, rispetto ai valori di tensione originari

Campionamento e Quantizzazione

c) La stessa onda ricostruita, dove si nota una maggior aderenza alla “vecchia” sine wave, paragonata a quella della figura a.

Campionamento e Quantizzazione

La differenza tra il valore di tensione misurato e il valore attribuito al campione durante il processo di quantizzazione viene appunto definito “errore di quantizzazione”. La risoluzione che scegliamo ha impatto ovviamente sul “rapporto segnale rumore” all’interno del circuito ADC, come ovviamente il range dinamico sfruttabile all’interno del circuito (che in un circuito ADC viene definito SQNR, signal to quantizazion noise ratio) che, idealmente e senza stare troppo a incasinarci con i numeri, si calcola moltiplicando per 6 il numero di bit di quantizzazione. A 16 bit, SQNR corrisponde a circa 96 dB mentre a 24 bit il range teorico aumenta a 144 dB che incorpora abbondantemente i limiti delle capacità uditive dell’essere umano. In ogni caso, ho scoperto in una mia lettura recente che è pressoché universalmente riconosciuto un massimo SNR pari a poco più di 120 dB (attorno ai 21 bit) a causa dei vincoli costruttivi nella progettazione dei circuiti integrati moderni.

La scelta ottimale sarebbe quella di optare, sempre, per la maggior risoluzione possibile. Di contro però questa scelta fa i conti con la necessità di lavorare con file di dimensioni maggiori, con aggravio di costi (pur oggigiorno meno importanti rispetto a solamente un lustro fa…) per maggiori prestazioni, spazio di archiviazione, ecc.

Per rendere meglio l’idea, la regola per calcolare le dimensioni di un file audio è molto semplice: questa è data dal prodotto di risoluzione in bit, frequenza di campionamento in Hz, numero di canali (ovviamente un file mono avrà un peso, un file stereo con le stesse caratteristiche peserà il doppio) e lunghezza – durata in secondi – del file), ovvero:

Dimensioni file audio in bit = no. bit X freq. di camp. in Herz X durata in secondi X numero canali

Un file Wave stereo a 16 bit 44,1 KHz (le caratteristiche dei file audio stampati su CD audio) di 4 minuti peserà quindi:

16 X 44.100 X 240 X 2 = 338.688.000 bit, pari a 40,37 Mb ( 1 Mb = 8.388.608 bit).

Lo stesso file, con stessa frequenza di campionamento, ma risoluzione pari a 24 bit peserà invece:

24 X 44.100 X 240 X 2 = 508.032.000 bit, pari a 60,56 Mb

Sul singolo file ovviamente la differenza è poco significativa, moltiplicatela però per tutti i file audio che acquisite durante una registrazione di un brano e potete capire come, seppur oggi la registrazione a 24 bit sia più che consolidata (io stesso, in registrazione, non riprendo mai sotto i 24 bit con frequenza di campionamento a 48 KHz), anche solo pochi anni fa la diversa richiesta di spazio di archiviazione era dirimente sulla scelta della risoluzione del progetto.

In chiusura, vi proponiamo un’immaginetta carina, abbiamo ulteriormente sviluppato l’immagine presente nel precedente articolo aggiungendo un terzo riquadro con la stessa immagine della “Notte Stellata” con un ridottissimo numero di colori disponibili che, nel nostro caso, si può ricondurre ad una bassissima bit depth.

Campionamento e Quantizzazione


tecniche di registrazione
Link utili
I convertitori: prologo
La frequenza di campionamento
Nascondi commenti     8
Loggati per commentare

Le figure...
di swing [user #1906]
commento del 14/05/2015 ore 21:06:32
Sbaglio io se dico che non vedo differenze tra le figure a, b e c?
Rispondi
Re: Le figure...
di luke_pathwaves [user #33262]
commento del 14/05/2015 ore 21:56:00
Ciao swing! Diciamo che sbagli solo in parte, eheheh ;-P infatti le ricostruzioni in (b) e (c) sono esattamente identiche, la sola differenza tra le due immagini è che in (c) abbiamo eliminato l'onda sinusoidale originale...la ricostruzione in (a) invece è leggermente diversa (vero comunque che a queste definizioni si può non percepire al 100%...), meno precisa...fai caso, ad esempio, alla "pendenza" del secondo segmento delle due ricostruzioni...più marcata in (a) e meno fedele al segnale originale, ed un po' più definita in (b) e (c)
Rispondi
Re: Le figure...
di fenderpassion61 [user #13902]
commento del 16/05/2015 ore 20:44:09
Con quella scala non si capisce la differenza tra diversi bit di risoluzione. Un crop della zona dei punti avrebbe sicuramente aiutato.
Rispondi
Re: Le figure...
di calledb [user #22605]
commento del 16/05/2015 ore 09:03:30
Non sbagli affatto.. le figure a,b,c, sono pressoché identiche, l'onda delle figure b e c andrebbe rappresentata in modo diverso, data la risoluzione tripla se non quadrupla.. anche perchè in TEORIA all'aumentare della risoluzione dovrebbe aumentare adeguatamente anche il sample-rate.. qui rimane fermo a 10hz
Rispondi
Re: Le figure...
di swing [user #1906]
commento del 16/05/2015 ore 14:23:00
Infatti..mi è sembrato un semplice copia-incolla della curva verde su sfondi diversi, almeno si sarebbe potuto aumentare i punti di divisione per visualizzare l'aumentare della frequenza di sampling :)
Rispondi
Nyquist? se non lo tirate ...
di RedRaven [user #20706]
commento del 14/05/2015 ore 22:10:33
Nyquist? se non lo tirate fuori sembra che il campionamento sia solo lossy, per la serie le immagini spixellano e van gogh diventa una ciofeca :)
Rispondi
ulteriori precisazioni
di oscar1965 [user #19484]
commento del 26/05/2015 ore 23:42:58
Il mese scorso mi ero scaricato gratuitamente un PDF sul Signal Processing e ho controllato un po' di cose (studiate circa 30 anni fa):
1) si intende con "rumore" la differenza tra il valore atteso e il valore attuale (non solo per l'audio), e nel caso di un convertitore AD l'errore di quantizzazione, noto a priori, viene riconsiderato in "rumore": questo e' il valore minimo per un AD ideale (che già' a 16 bit e' cmq trascurabile), poi un AD reale avra' valori maggiori di rumore e conseguentemente un peggiore Signal to Noise Ratio;
2) oltre che all'errore di quantizzazione e conseguente "rumore", il problema principale della quantizzazione sono le variazioni nel campo della frequenza rispetto al segnale originale, cui si cerca di rimediare nella conversione duale DA tramite dithering; su quest'ultima cosa ho trovato poche informazioni in rete (cioè' di quanto il dithering peggiora ulteriormente il segnale, si tratta di un ulteriore "rumore" volutamente aggiunto);
Anche se andava aggiunto all'articolo precedente, ricordo anche che:
3) il filtro passa-basso indispensabile per soddisfare i requisiti del teorema di Nyquist e evitare eventuali aliasing, e' d'aiuto anche per l'applicazione della teoria alla base della quantizzazione, che richiede appunto che il segnale abbia una componente armonica con un numero finito di frequenze (e invece i segnali che hanno un inizio ed una fine, nell'istante in cui iniziano o finiscono hanno in teoria un numero infinito di frequenze); tuttavia sono in tanti a dire che l'eliminare le componenti armoniche dei segnali sopra i N kHz (20 kHz o 48 kHz o 96 kHz ecc), sia a regime ma soprattutto nei transitori d'attacco, sommata al degrado della quantizzazione, impoverisce molto il segnale (anche se non sempre l'orecchio umano, restando nell'analogico, lo percepirebbe)
Rispondi
Loggati per commentare

di Claes [user #29011]
commento del 08/11/2015 ore 17:20:00
Bassa qualità di bits può essere di gran lunga mgliore che altissima. Questo parte dall'anno della pietra... Ensoniq Mirage, Emu Emax e Akai S-1000. Vale per cassa, rullante, basso e pure un sacco di suoni synths tipo pads e imitazioni di MiniMoog. Samples sono cortissimi e da manovrare adequatamente per suoni da pads che necessitano durata infinita fintanto si tiene premuto un tasto sulla tastiera. I suoni da batteria completa devono durare ultra-poco dato che vi erano solo da 2 a 4 secondi per un patch completo su un disk di quelli vintage! Un sound hi-fi è molto anemico e non è detto che valga per piste di questo tipo. Eccovi un esempio tra i tanti - è Denniz PoP / Cheiron Studios (Svezia) e la batteria lo-fi più forte del regno Emax e S-1000. Canta Leila K (Mega Records). vai al link

Rispondi
Altro da leggere
Sessioni di studio/play con la chitarra elettrica in cuffia: quale setup?
Registrare la batteria al meglio in home studio
Home recording: plugin entry level da avere
Le migliori DAW per iniziare
Storia della registrazione: quando la musica cambiò per sempre
IR, software e finali simulati: cosa scegliere?
Articoli più letti
Seguici anche su:
Scrivono i lettori
Manuale di sopravvivenza digitale
Hotone Omni AC: quel plus per la chitarra acustica
Charvel Pro-Mod DK24 HSH 2PT CM Mahogany Natural
Pedaliere digitali con pedali analogici: perché no?!
Sonicake Matribox: non solo un giochino per chi inizia
Ambrosi-Amps: storia di un super-solid-state mai nato
Il sarcofago maledetto (e valvolare) di Dave Jones
Neural DSP Quad Cortex: troppo per quello che faccio?
Massa, sustain, tono e altri animali fantastici
Ho rifatto la Harley (Benton ST-57DG)




Licenza Creative Commons - Privacy - Accordo.it Srl - P.IVA 04265970964