Este artigo foi originalmente publicado por Phil Edwards em VOX
Às vezes é difícil apreciar que as incontáveis vozes eletrônicas que ouvimos, desde o prompt no auto-checkout até o tom desencarnado vindo dos nossos telefones, foram fornecidas por uma pessoa real. De onde vêm essas vozes? Para saber, perguntei à voz original da assistente do iPhone Siri, Susan Bennett.
p>Ela é uma atriz de voz que, além da sua obra icônica do iPhone, faz comerciais, canta e fornece vozes para muitas outras empresas e serviços. E ela explicou como funciona a sua indústria única.
Como Susan Bennett se tornou a voz original de Siri – e o que ela diz sobre voz de atriz
Falar com Susan Bennett é surreal – num momento ela parece completamente normal, excepto que ela tem a voz mais agradável que alguma vez ouviu. Mas num instante ela pode ligar a voz de Siri, e você começa a pensar que está falando com seu computador.
Bennett é uma nativa de Burlington, Vermont, que se mudou para o norte de Nova York quando ela era jovem, e seu passado lhe deu um estilo neutro de falar americano. Depois de atuar e cantar na Brown University, ela foi para Twangy Atlanta, onde a sua voz clara e sem perfume lhe deu uma vantagem competitiva única.
De uma forma ou de outra, ela tem humanizado os computadores por décadas
Nos anos 70, Bennett invadiu a voz atuando humanizando um computador muito diferente de Siri, cantando o jingle para Tillie the All Time Teller, um dos primeiros ATMs. Durante décadas, Bennett gravou a narração para serviços de atendimento, sistemas de PA e outros clientes que vão desde grandes e corporativos até pequenos e locais. Essa experiência a levou ao seu mais reconhecido show.
Quando Bennett gravou a voz para Siri em 2005, ela não tinha idéia de que ela iria acabar no iPhone. Ela a gravou bem antes da empresa que construiu a Siri ser comprada pela Apple, e ela nem sabia que era a voz da Siri até que o produto estreou na App Store em 2010 e depois apareceu no iPhone 4S em 2011. Mas por mais perfeito que Bennett soe como Siri, foi um projeto surpreendentemente difícil capturar sua voz.
Como um assistente digital como Siri é gravado
Siri precisa ser capaz de dizer quase tudo na língua inglesa, e isso exigiu muito trabalho duro.
“Eu gravei quatro horas por dia, cinco dias por semana para o mês de julho”, diz Bennett. Para um ator de voz, essa carga de trabalho causa muita tensão. “Isso é muito tempo para estar falando constantemente. Consequentemente, você fica cansado”, diz Bennett. “
A Siri original “era para soar no outro mundo e ter um senso de humor seco”. Ela acrescentou que para ela assumir a personagem, mesmo quando ela se concentrava em permanecer consistente e clara.
A atuação de voz requer sempre alguma perspicácia técnica – como diz Bennett, trata-se de “poder ler 65 segundos de cópia em 60 segundos”. Mas gravar para uma voz computadorizada como a Siri é especialmente difícil. Estas sessões vocais maratona não envolveram a leitura de palavras ou frases completas. Ao invés disso, ela gravou as matérias-primas para a fala – sons básicos.
A técnica de usar programas sofisticados de computador para construir palavras e frases a partir de sons básicos é chamada de fala batida (o site irmã da Vox The Verge descreveu o processo de ligar esses sons em 2013). O objectivo é tentar incluir todos os sons possíveis (normalmente extraídos de um bloco de construção de sílabas) para que possam ser montados em todas as combinações possíveis para cada palavra possível.
Para gravá-los, os actores de voz são forçados a recitar frases parecidas com algaraventos que incluem todos os sons diferentes da língua inglesa.
No seu estúdio em casa, Bennett gravou algumas frases para mim. Ela tinha guardado um script antigo para uma voz digital que tinha feito antes para a Lucent Technologies, incluindo frases absurdas como “oil your mill jewel weed today”. Bennett chama-lhe “poesia de voz digital”, e ela sugere que se beba um copo de vinho enquanto se ouve:
O processo pode demorar um pouco porque o objectivo é gravar o maior número possível de variedades e tipos de sons, de modo a fazer um discurso melhor e mais humano. Por exemplo, actores como Bennett não precisam apenas de gravar um som “s” – precisam de gravar os vários sons “s” em palavras como “hiss”, “snakes” e “rose”. Eventualmente, os sons são costurados juntos por um computador, com o objetivo de aumentar cada vez mais o som naturalista.
Bennett acha que algumas novas gravações provavelmente foram incorporadas na versão atual do Siri, para melhorá-la e fornecer mais opções para os usuários. Isso significa que o assistente digital que você ouve no seu telefone hoje é provavelmente um mashup de diferentes vozes humanas, incluindo Bennett e outros, amarrados juntos em um programa útil.
Nova tecnologia transformou a atuação da voz em um negócio altamente competitivo
p>p>P>P>P>É mais importante do que nunca que Bennett seja capaz de dizer que ela era a voz original de Siri. Ela serve como uma marca única em um negócio onde sempre há novos talentos tentando conseguir o próximo show. E esse espírito competitivo estende-se ao estúdio de Bennett em casa, o que faria qualquer audiófilo invejar.
É construído sobre pés de borracha para absorver o som, e ela usa-o todos os dias. Tem espuma na parede, uma mesa com pré-amplificador e mixer e um microfone Neumann TLM 193 (preço médio: $1,599). Sentada em um banco ajustável, ela lê seus scripts de um iPad e tem um monitor de computador para ver como está indo a gravação.
Ela investiu seriamente em seu estúdio porque a maioria de suas gravações ocorre em casa, típico de muitos atores de voz. Graças às conexões mundiais de alta qualidade – iniciadas com linhas ISDN de alta qualidade e estendendo-se à atual banda larga de fibra ótica – é possível para atores de todo o mundo gravar de casa e competir uns com os outros. Como tantas indústrias, a tecnologia mudou tudo para os atores de voz.
“Você poderia escolher um talento de qualquer lugar e gravar essa pessoa de qualquer outro lugar”, diz Bennett. “Todas as pessoas de qualquer cidade não estavam mais limitadas ao seu grupo local de atores”. Eles podiam ir a qualquer lugar do mundo”.
Ela instalou seu ISDN em 1996, e para permanecerem competitivos, muitos atores de voz fizeram o mesmo. A tecnologia trouxe grandes oportunidades ao negócio, assim como uma concorrência mais forte.
Mas por mais competitivo que seja o voiceover, as vozes serão sempre necessárias
Bennett cuida de sua voz: bebendo água morna às vezes ao invés de chá, bebendo ocasionalmente um pouco de mel, e evitando limpar sua garganta.
Mas não há estratégia mágica para se tornar um actor de voz, porque algo na voz é inato.
“Acho que as vozes são muito pessoais”, diz ela, “e acho que essa é uma das razões pelas quais as pessoas amam Siri e todos os outros assistentes digitais, porque eles trazem um pouco de humanidade a toda essa maquinaria com a qual estamos lidando”
É improvável que isso mude, mesmo quando as vozes computadorizadas se tornam mais comuns. Algo sobre uma voz não pode ser simulado. Isso é muito claro quando se fala com a Susan Bennett e se ouve o som dela tal como a Siri. Mas é ainda mais claro quando ela quebra o caráter e começa a rir.