Questo articolo è stato originariamente pubblicato da Phil Edwards su VOX
A volte è difficile apprezzare che le innumerevoli voci elettroniche che sentiamo, dal prompt alla cassa automatica al tono disincarnato proveniente dai nostri telefoni, sono state fornite da una persona reale. Da dove vengono queste voci? Per scoprirlo, ho chiesto alla voce originale dell’assistente dell’iPhone Siri, Susan Bennett.
È una doppiatrice che, oltre alla sua iconica opera per l’iPhone, fa spot pubblicitari, canta e fornisce voci per molte altre aziende e servizi. E ci ha spiegato come funziona la sua unica industria.
- Come Susan Bennett è diventata la voce originale di Siri – e cosa dice del doppiaggio
- Come viene registrata un’assistente digitale come Siri
- La nuova tecnologia ha trasformato il doppiaggio in un business altamente competitivo
- Ma per quanto competitivo sia il voiceover, le voci saranno sempre necessarie
Come Susan Bennett è diventata la voce originale di Siri – e cosa dice del doppiaggio
Parlare con Susan Bennett è surreale – in un momento sembra completamente normale, tranne che ha la voce più piacevole che abbiate mai sentito. Ma in un attimo può attivare la voce di Siri, e cominci a pensare che stai parlando con il tuo computer.
Bennett è originaria di Burlington, Vermont, che si è trasferita a New York quando era giovane, e il suo background le ha dato uno stile neutro di parlare americano. Dopo aver recitato e cantato alla Brown University, è andata ad Atlanta, dove la sua voce chiara e non accentata le ha dato un vantaggio competitivo unico.
In un modo o nell’altro, ha umanizzato i computer per decenni
Negli anni ’70, Bennett ha fatto il suo ingresso nel mondo del doppiaggio umanizzando un computer molto diverso da Siri, cantando il jingle per Tillie the All Time Teller, uno dei primi bancomat. Per decenni, Bennett ha registrato la narrazione per servizi di segreteria telefonica, sistemi PA e altri clienti che vanno dal grande e aziendale al piccolo e locale. Questa esperienza l’ha portata al suo lavoro più riconoscibile.
Quando Bennett ha registrato la voce per Siri nel 2005, non aveva idea che sarebbe finita sull’iPhone. L’ha registrata ben prima che l’azienda che ha costruito Siri fosse acquistata da Apple, e non sapeva nemmeno di essere la voce di Siri fino a quando il prodotto ha debuttato nell’App Store nel 2010 e poi è apparso sull’iPhone 4S nel 2011. Ma per quanto Bennett suoni senza soluzione di continuità come Siri, è stato un progetto sorprendentemente difficile catturare la sua voce.
Come viene registrata un’assistente digitale come Siri
Siri deve essere in grado di dire praticamente tutto in lingua inglese, e questo ha richiesto molto duro lavoro.
“Ho registrato quattro ore al giorno, cinque giorni a settimana per il mese di luglio”, dice Bennett. Per un doppiatore, questo carico di lavoro provoca molta tensione. “È molto tempo per parlare costantemente. Di conseguenza, ci si stanca.”
La Siri originale “doveva avere un suono ultraterreno e un secco senso dell’umorismo”, dice Bennett. Ha aggiunto questo alla sua interpretazione del personaggio, anche se si è concentrata sul rimanere coerente e chiara.
La recitazione vocale richiede sempre un certo acume tecnico – come dice Bennett, si tratta di “essere in grado di leggere 65 secondi di copia in 60 secondi”. Ma registrare per una voce computerizzata come Siri è particolarmente difficile. Queste maratone vocali non hanno comportato la lettura di parole o frasi complete. Invece, ha registrato le materie prime per il discorso – suoni di base.
La tecnica di usare sofisticati programmi informatici per costruire parole e frasi dai suoni di base è chiamata discorso concatenato (il sito gemello di Vox The Verge ha descritto il processo di collegamento di questi suoni nel 2013). L’obiettivo è cercare di includere ogni possibile suono (di solito tratto da un blocco di sillabe) in modo che possano essere assemblati in ogni possibile combinazione per ogni possibile parola.
Per registrarli, i doppiatori sono costretti a recitare frasi gibbose che includono tutti i diversi suoni della lingua inglese.
A casa sua, Bennett ha registrato alcune frasi per me. Aveva salvato una vecchia sceneggiatura per una voce digitale che aveva fatto in precedenza per Lucent Technologies, includendo frasi assurde come “oil your mills jewel weed today”. Bennett la chiama “poesia della voce digitale”, e suggerisce di prendere un bicchiere di vino durante l’ascolto:
Il processo può richiedere un po’ di tempo perché l’obiettivo è quello di registrare quante più varietà e tipi di suoni possibili, al fine di rendere un discorso migliore e dal suono più umano. Per esempio, attori come Bennett non hanno solo bisogno di registrare un suono “s” – hanno bisogno di registrare i vari suoni “s” in parole come “sibilo”, “serpenti” e “rosa”. Alla fine, i suoni sono cuciti insieme da un computer, con l’obiettivo di un suono sempre più naturalistico.
Bennett pensa che alcune nuove registrazioni siano state probabilmente incorporate nella versione attuale di Siri, per migliorarla e fornire più opzioni agli utenti. Questo significa che l’assistente digitale che sentite oggi sul vostro telefono è probabilmente un mashup di diverse voci umane, tra cui Bennett e altre, messe insieme in un unico programma utile.
La nuova tecnologia ha trasformato il doppiaggio in un business altamente competitivo
Ancora, è più importante che mai che Bennett possa dire di essere stata la voce originale di Siri. Serve come un marcatore unico in un business dove ci sono sempre nuovi talenti che cercano di ottenere il prossimo lavoro. E questo spirito competitivo si estende allo studio di casa di Bennett, che farebbe invidia a qualsiasi audiofilo.
È costruito su piedi di gomma per assorbire il suono, e lei lo usa ogni giorno. C’è della schiuma sul muro, una scrivania con un preamplificatore e un mixer, e un microfono Neumann TLM 193 (prezzo medio: 1.599 dollari). Seduta su uno sgabello regolabile, legge i suoi copioni da un iPad e ha un monitor per vedere come procede la registrazione.
Ha investito seriamente nel suo studio perché la maggior parte delle sue registrazioni avviene a casa, tipico di molti doppiatori. Grazie alle connessioni di alta qualità in tutto il mondo – iniziate con linee ISDN di alta qualità ed estese alla banda larga in fibra ottica di oggi – è possibile per gli attori di tutto il mondo registrare da casa e competere tra loro. Come in molti altri settori, la tecnologia ha cambiato tutto per i doppiatori.
“Si può scegliere un talento da qualsiasi luogo e registrare quella persona da qualsiasi altro luogo”, dice Bennett. “Tutte le persone di qualsiasi città non erano più limitate al loro gruppo locale di attori. Potevano andare ovunque nel mondo.”
Ha installato il suo ISDN nel 1996, e per rimanere competitivi, molti doppiatori hanno fatto lo stesso. La tecnologia ha portato grandi opportunità al business, così come una concorrenza più agguerrita.
Ma per quanto competitivo sia il voiceover, le voci saranno sempre necessarie
Bennett si prende cura della sua voce: bevendo a volte acqua tiepida invece del tè, mangiando occasionalmente del miele, ed evitando di schiarirsi la gola.
Ma non c’è una strategia magica per diventare un doppiatore, perché qualcosa nella voce è innato.
“Penso che le voci siano molto personali”, dice, “e credo che questo sia uno dei motivi per cui la gente ama Siri e tutti gli altri assistenti digitali, perché portano un po’ di umanità a tutte queste macchine con cui abbiamo a che fare”
Questo è improbabile che cambi, anche se le voci computerizzate diventano più comuni. C’è qualcosa in una voce che non può essere simulata. Questo è molto chiaro quando si parla con Susan Bennett e la si sente parlare proprio come Siri. Ma è ancora più chiaro quando lei esce dal personaggio e comincia a ridere.