Il sistema televisivo di ogni paese specificherà un numero di canali televisivi all’interno delle gamme di frequenza UHF o VHF. Un canale in realtà consiste di due segnali: l’informazione dell’immagine è trasmessa usando la modulazione di ampiezza su una frequenza, e il suono è trasmesso con modulazione di frequenza ad una frequenza ad un offset fisso (tipicamente da 4,5 a 6 MHz) dal segnale dell’immagine.
Le frequenze dei canali scelte rappresentano un compromesso tra permettere una larghezza di banda sufficiente per il video (e quindi una risoluzione soddisfacente dell’immagine), e permettere un numero sufficiente di canali da stipare nella banda di frequenza disponibile. In pratica una tecnica chiamata banda laterale vestigiale è usata per ridurre la spaziatura dei canali, che sarebbe quasi il doppio della larghezza di banda video se fosse usata la pura AM.
La ricezione del segnale avviene invariabilmente tramite un ricevitore supereterodina: il primo stadio è un sintonizzatore che seleziona un canale televisivo e lo sposta in frequenza ad una frequenza intermedia fissa (IF). L’amplificatore di segnale esegue l’amplificazione agli stadi IF dalla gamma di microvolt a frazioni di un volt.
Estrazione del suono
A questo punto il segnale IF consiste in un segnale video portante ad una frequenza e la portante sonora ad un offset fisso. Un demodulatore recupera il segnale video. All’uscita dello stesso demodulatore c’è anche una nuova portante sonora modulata in frequenza alla frequenza di offset. In alcuni apparecchi costruiti prima del 1948, questo veniva filtrato, e l’IF del suono di circa 22 MHz veniva inviato a un demodulatore FM per recuperare il segnale sonoro di base. Negli apparecchi più recenti, questa nuova portante alla frequenza di offset poteva rimanere come suono interportante, e veniva inviata ad un demodulatore FM per recuperare il segnale sonoro di base. Un particolare vantaggio del suono interportante è che quando si regola la manopola di sintonia fine del pannello frontale, la frequenza della portante sonora non cambia con la sintonizzazione, ma rimane alla suddetta frequenza di offset. Di conseguenza, è più facile sintonizzare l’immagine senza perdere il suono.
La portante sonora FM viene quindi demodulata, amplificata e usata per pilotare un altoparlante. Fino all’avvento dei sistemi NICAM e MTS, le trasmissioni audio televisive erano invariabilmente monofoniche.
Struttura di un segnale videoModifica
La portante video viene demodulata per dare un segnale video composito; questo contiene segnali di luminanza, crominanza e sincronizzazione; questo è identico al formato del segnale video usato dai dispositivi video analogici come i videoregistratori o le telecamere CCTV. Si noti che la modulazione del segnale RF è invertita rispetto all’AM convenzionale: il livello minimo del segnale video corrisponde alla massima ampiezza della portante, e viceversa. Per assicurare una buona linearità (fedeltà), coerente con i costi di fabbricazione accessibili di trasmettitori e ricevitori, la portante video non è mai spenta del tutto. Quando più tardi, nel 1948, fu inventato il suono interportante, il non spegnere completamente la portante ebbe l’effetto collaterale di permettere l’implementazione economica del suono interportante.
Ogni linea dell’immagine visualizzata è trasmessa usando un segnale come mostrato sopra. Lo stesso formato di base (con piccole differenze legate principalmente ai tempi e alla codifica del colore) è usato per i sistemi televisivi PAL, NTSC e SECAM. Un segnale monocromatico è identico a uno a colori, con l’eccezione che gli elementi mostrati a colori nel diagramma (il burst di colore e il segnale di crominanza) non sono presenti.
Il front porch è un breve (circa 1,5 microsecondi) periodo inserito tra la fine di ogni linea di immagine trasmessa e il leading edge del successivo impulso di sincronizzazione di linea. Il suo scopo era quello di permettere ai livelli di tensione di stabilizzarsi nei vecchi televisori, prevenendo le interferenze tra le linee di immagine. Il front porch è il primo componente dell’intervallo di blanking orizzontale che contiene anche l’impulso di sincronizzazione orizzontale e il back porch.
Il back porch è la porzione di ogni linea di scansione tra la fine (fronte di salita) dell’impulso di sincronizzazione orizzontale e l’inizio del video attivo. È usato per ripristinare il livello del nero (300 mV) di riferimento nel video analogico. In termini di elaborazione del segnale, compensa il tempo di caduta e di assestamento che segue l’impulso di sincronizzazione.
Nei sistemi televisivi a colori come PAL e NTSC, questo periodo include anche il segnale di colorburst. Nel sistema SECAM, contiene la sottoportante di riferimento per ogni segnale di differenza di colore consecutivo, al fine di impostare il riferimento di colore zero.
In alcuni sistemi professionali, in particolare i collegamenti satellitari tra località, l’audio è incorporato nella porzione posteriore del segnale video, per risparmiare il costo dell’affitto di un secondo canale.
Estrazione del segnale video monocromoModifica
La componente di luminanza di un segnale video composito varia tra 0 V e circa 0,7 V sopra il livello “nero”. Nel sistema NTSC, c’è un livello di segnale di blanking utilizzato durante il front porch e back porch, e un livello di segnale nero 75 mV sopra di esso; in PAL e SECAM questi sono identici.
In un ricevitore monocromatico il segnale di luminanza è amplificato per pilotare la griglia di controllo nel cannone elettronico del CRT. Questo cambia l’intensità del fascio di elettroni e quindi la luminosità dello spot che viene scansionato. I controlli di luminosità e contrasto determinano rispettivamente lo spostamento DC e l’amplificazione.
Estrazione del segnale video a coloriModifica
Un segnale a colori trasmette informazioni di immagine per ciascuna delle componenti rossa, verde e blu di un’immagine (vedere l’articolo sullo spazio colore per maggiori informazioni). Tuttavia, queste non sono semplicemente trasmesse come tre segnali separati, perché: un tale segnale non sarebbe compatibile con i ricevitori monocromatici (una considerazione importante quando la trasmissione a colori fu introdotta per la prima volta). Inoltre occuperebbe tre volte la larghezza di banda della televisione esistente, richiedendo una diminuzione del numero di canali televisivi disponibili. Inoltre, i problemi tipici della trasmissione del segnale (come i diversi livelli di segnale ricevuto tra i diversi colori) produrrebbero spiacevoli effetti collaterali.
Invece, i segnali RGB sono convertiti in forma YUV, dove il segnale Y rappresenta la luminosità e l’oscurità (luminanza) dei colori nell’immagine. Poiché la resa dei colori in questo modo è l’obiettivo sia dei film in bianco e nero (monocromatici) che dei sistemi televisivi in bianco e nero (monocromatici), il segnale Y è ideale per la trasmissione come segnale di luminanza. Questo assicura che un ricevitore monocromatico visualizzerà un’immagine corretta in bianco e nero, dove un dato colore è riprodotto da una tonalità di grigio che riflette correttamente quanto è chiaro o scuro il colore originale.
I segnali U e V sono segnali di “differenza di colore”. Il segnale U è la differenza tra il segnale B e il segnale Y, noto anche come B meno Y (B-Y), e il segnale V è la differenza tra il segnale R e il segnale Y, noto anche come R meno Y (R-Y). Il segnale U rappresenta quindi quanto il colore è “blu-violaceo” o il suo complementare “giallo-verde”, e il segnale V quanto è “rosso-violaceo” o il suo complementare “ciano-verdastro”. Il vantaggio di questo schema è che i segnali U e V sono zero quando l’immagine non ha contenuto di colore. Poiché l’occhio umano è più sensibile al dettaglio nella luminanza che nel colore, i segnali U e V possono essere trasmessi in un modo relativamente privo di perdite (in particolare: con larghezza di banda limitata) con risultati accettabili.
Nel ricevitore, un singolo demodulatore può estrarre una combinazione additiva di U più V. Un esempio è il demodulatore X usato nel sistema di demodulazione X/Z. In quello stesso sistema, un secondo demodulatore, il demodulatore Z, estrae anche una combinazione additiva di U più V, ma in un rapporto diverso. I segnali di differenza di colore X e Z sono ulteriormente matricizzati in tre segnali di differenza di colore, (R-Y), (B-Y) e (G-Y). Le combinazioni di solito due, ma a volte tre demodulatori erano:
- (I) / (Q), (come usato nell’RCA CTC-2 del 1954 e nella serie RCA “Colortrak” del 1985, e nell’Arvin del 1954, e in alcuni monitor a colori professionali degli anni ’90),
- (R-Y) / (Q), come usato nel ricevitore a colori RCA 21 pollici del 1955,
- (R-Y) / (B-Y), usato nel primo ricevitore a colori sul mercato (Westinghouse, non RCA),
- (R-Y) / (G-Y), (come usato nel telaio RCA Victor CTC-4),
- (R-Y) / (B-Y) / (G-Y),
- (X) / (Z), come usato in molti ricevitori di fine anni ’50 e per tutti gli anni ’60.
Alla fine, un’ulteriore matrice dei segnali di differenza di colore da c a f ha prodotto i tre segnali di differenza di colore, (R-Y), (B-Y), e (G-Y).
I segnali R, G, B nel ricevitore necessario per il dispositivo di visualizzazione (CRT, schermo al plasma, o display LCD) sono derivati elettronicamente dalla matrice come segue: R è la combinazione additiva di (R-Y) con Y, G è la combinazione additiva di (G-Y) con Y, e B è la combinazione additiva di (B-Y) con Y. Tutto questo viene realizzato elettronicamente. Si può vedere che nel processo di combinazione, la porzione a bassa risoluzione dei segnali Y si annulla, lasciando i segnali R, G e B in grado di rendere un’immagine a bassa risoluzione in pieno colore. Tuttavia, le porzioni a più alta risoluzione dei segnali Y non si annullano, e quindi sono ugualmente presenti in R, G e B, producendo il dettaglio dell’immagine a più alta definizione (a più alta risoluzione) in monocromia, anche se all’occhio umano appare come un’immagine a colori e a piena risoluzione.
Nei sistemi a colori NTSC e PAL, U e V sono trasmessi utilizzando la modulazione di ampiezza in quadratura di una sottoportante. Questo tipo di modulazione applica due segnali indipendenti a una sottoportante, con l’idea che entrambi i segnali saranno recuperati indipendentemente all’estremità ricevente. Prima della trasmissione, la sottoportante stessa viene rimossa dalla porzione attiva (visibile) del video, e spostata, sotto forma di burst, nella porzione di blanking orizzontale, che non è direttamente visibile sullo schermo. (Per saperne di più sul burst di seguito.)
Per il sistema NTSC, la sottoportante è un’onda sinusoidale di 3,58 MHz. Per il sistema PAL è un’onda sinusoidale di 4,43 MHz. Dopo la suddetta modulazione di ampiezza in quadratura della sottoportante, vengono prodotte le bande laterali della sottoportante, e la sottoportante stessa viene filtrata dalla porzione visibile del video, poiché sono le bande laterali della sottoportante che portano tutte le informazioni U e V, e la sottoportante stessa non porta informazioni.
Le bande laterali risultanti della sottoportante sono anche conosciute come “croma” o “crominanza”. Fisicamente, questo segnale di crominanza è un’onda sinusoidale di 3,58 MHz (NTSC) o 4,43 MHz (PAL) che, in risposta al cambiamento dei valori U e V, cambia fase rispetto alla sottoportante, e cambia anche ampiezza.
Come risulta, l’ampiezza della crominanza (quando considerata insieme al segnale Y) rappresenta la saturazione approssimativa di un colore, e la fase della crominanza rispetto alla sottoportante come riferimento rappresenta approssimativamente la tonalità del colore. Per particolari colori di prova che si trovano nel modello della barra dei colori di prova, le ampiezze e le fasi esatte sono talvolta definite solo per scopi di prova e di risoluzione dei problemi.
Anche se in risposta al cambiamento dei valori U e V, l’onda sinusoidale di croma cambia fase rispetto alla sottoportante, non è corretto dire che la sottoportante è semplicemente “modulata in fase”. Questo perché un singolo segnale di prova sinusoidale U con QAM produce solo una coppia di bande laterali, mentre una vera modulazione di fase nelle stesse condizioni di prova produrrebbe più serie di bande laterali che occupano un maggior spettro di frequenze.
In NTSC, la sinusoide di crominanza ha la stessa frequenza media della frequenza della sottoportante. Ma uno strumento analizzatore di spettro mostra che, per la crominanza trasmessa, la componente di frequenza alla frequenza della sottoportante è in realtà energia zero, verificando che la sottoportante è stata effettivamente rimossa prima della trasmissione.
Queste frequenze di banda laterale sono all’interno della banda del segnale di luminanza, ed è per questo che sono chiamate bande laterali “sottoportanti” invece che semplicemente “portanti”. Le loro esatte frequenze sono state scelte in modo tale che (per NTSC), sono a metà strada tra due armoniche della frequenza di ripetizione del fotogramma, assicurando così che la maggior parte della potenza del segnale di luminanza non si sovrapponga alla potenza del segnale di crominanza.
Nel sistema britannico PAL (D), la frequenza centrale effettiva della crominanza, con bande laterali inferiori e superiori uguali, è 4,43361875 MHz, un multiplo diretto della frequenza di scansione. Questa frequenza è stata scelta per minimizzare il modello di interferenza del battimento di crominanza che sarebbe visibile nelle aree di alta saturazione del colore nell’immagine trasmessa.
In certi momenti, il segnale di crominanza rappresenta solo il segnale U, e 70 nanosecondi (NTSC) dopo, il segnale di crominanza rappresenta solo il segnale V. (Questa è la natura del processo di modulazione di ampiezza in quadratura che ha creato il segnale di crominanza). Circa 70 nanosecondi dopo ancora, -U, e altri 70 nanosecondi, -V.
Così per estrarre U, si utilizza un demodulatore sincrono, che usa la sottoportante per campionare brevemente il croma ogni 280 nanosecondi, in modo che l’uscita sia solo un treno di impulsi discreti, ognuno con un’ampiezza che è la stessa del segnale originale U al momento corrispondente. In effetti, questi impulsi sono campioni analogici a tempo discreto del segnale U. Gli impulsi vengono poi filtrati in modo da recuperare il segnale analogico originale U a tempo continuo. Per V, una sottoportante spostata di 90 gradi cancella brevemente il segnale croma ogni 280 nanosecondi, e il resto del processo è identico a quello usato per il segnale U.
Gating in qualsiasi momento diverso da quelli menzionati sopra produrrà una miscela additiva di qualsiasi due di U, V, -U, o -V. Uno di questi metodi di gating “fuori asse” (cioè degli assi U e V) è chiamato demodulazione I/Q. Un altro schema “fuori asse” molto più popolare era il sistema di demodulazione X/Z. Un’ulteriore matricizzazione recuperava i segnali originali U e V. Questo schema era in realtà lo schema di demodulazione più popolare per tutti gli anni ’60.
Il processo di cui sopra usa la sottoportante. Ma come menzionato in precedenza, essa è stata cancellata prima della trasmissione, e solo la croma viene trasmessa. Pertanto, il ricevitore deve ricostituire la sottoportante. A questo scopo, un breve burst della sottoportante, noto come color burst, viene trasmesso durante il back porch (periodo di blanking di ritracciamento) di ogni linea di scansione. Un oscillatore a sottoportante nel ricevitore si blocca su questo segnale (vedi phase-locked loop) per ottenere un riferimento di fase, con il risultato che l’oscillatore produce la sottoportante ricostituita.
(Un secondo uso del burst in modelli di ricevitori più costosi o più recenti è un riferimento a un sistema AGC per compensare le imperfezioni del guadagno di croma nella ricezione.)
NTSC usa questo processo senza modifiche. Sfortunatamente, questo si traduce spesso in una cattiva riproduzione dei colori a causa di errori di fase nel segnale ricevuto, causati a volte da multipath, ma soprattutto da una cattiva implementazione alla fine dello studio. Con l’avvento dei ricevitori a stato solido, la TV via cavo e l’attrezzatura digitale da studio per la conversione in un segnale analogico over-the-air, questi problemi NTSC sono stati in gran parte risolti, lasciando l’errore dell’operatore alla fine dello studio come unica debolezza nella resa dei colori del sistema NTSC. In ogni caso, il sistema PAL D (ritardo) corregge principalmente questi tipi di errori invertendo la fase del segnale su ogni linea successiva, e facendo la media dei risultati su coppie di linee. Questo processo è ottenuto con l’uso di una linea di ritardo di durata 1H (dove H = frequenza di scansione orizzontale). (Un tipico circuito usato con questo dispositivo converte il segnale a colori a bassa frequenza in ultrasuoni e viceversa). Gli errori di sfasamento tra linee successive sono quindi annullati e l’ampiezza del segnale desiderato viene aumentata quando i due segnali in fase (coincidenti) vengono ricombinati.
NTSC è più efficiente nello spettro rispetto al PAL, dando più dettagli dell’immagine per una data larghezza di banda. Questo perché i sofisticati filtri a pettine nei ricevitori sono più efficaci con la cadenza di fase del colore a 4 campi del NTSC rispetto alla cadenza a 8 campi del PAL. Comunque, alla fine, la maggiore larghezza di canale della maggior parte dei sistemi PAL in Europa dà ancora ai loro sistemi PAL il vantaggio nella trasmissione di maggiori dettagli dell’immagine.
Nel sistema televisivo SECAM, U e V sono trasmessi su linee alternate, usando una semplice modulazione di frequenza di due diversi subcarrier di colore.
In alcuni display CRT analogici a colori, a partire dal 1956, il segnale di controllo della luminosità (luminanza) è alimentato alle connessioni catodiche dei cannoni elettronici, e i segnali di differenza di colore (segnali di crominanza) sono alimentati alle connessioni delle griglie di controllo. Questa semplice tecnica di miscelazione della matrice CRT è stata sostituita nei successivi progetti a stato solido di elaborazione del segnale con il metodo originale di matricizzazione usato nei ricevitori TV a colori del 1954 e 1955.