Este artículo fue publicado originalmente por Phil Edwards en VOX
A veces es difícil apreciar que las innumerables voces electrónicas que escuchamos, desde el aviso en la caja registradora hasta el tono incorpóreo que sale de nuestros teléfonos, fueron proporcionadas por una persona real. ¿De dónde vienen esas voces? Para averiguarlo, pregunté a la voz original del asistente del iPhone, Siri, Susan Bennett.
Es una actriz de doblaje que, además de su icónica obra para el iPhone, hace anuncios, canta y pone voz a muchas otras empresas y servicios. Y nos explicó cómo funciona su singular industria.
- Cómo Susan Bennett se convirtió en la voz original de Siri – y lo que dice sobre la actuación de voz
- Cómo se graba un asistente digital como Siri
- La nueva tecnología ha convertido la actuación de voz en un negocio altamente competitivo
- Pero por muy competitiva que sea la locución, las voces siempre serán necesarias
Cómo Susan Bennett se convirtió en la voz original de Siri – y lo que dice sobre la actuación de voz
Hablar con Susan Bennett es surrealista: en un momento parece completamente normal, salvo que tiene la voz más agradable que jamás hayas oído. Pero en un instante puede encender la voz de Siri, y empiezas a pensar que estás hablando con tu ordenador.
Bennett es una nativa de Burlington, Vermont, que se mudó al norte del estado de Nueva York cuando era joven, y su origen le dio un estilo de hablar americano neutro. Después de actuar y cantar en la Universidad de Brown, se marchó a la estridente Atlanta, donde su voz clara y sin acentos le ha dado una ventaja competitiva única.
De una forma u otra, lleva décadas humanizando ordenadores
En los años 70, Bennett irrumpió en la actuación de voz humanizando un ordenador muy diferente a Siri, cantando el jingle de Tillie the All Time Teller, uno de los primeros cajeros automáticos. Durante décadas, Bennett grabó la narración para servicios de respuesta, sistemas de megafonía y otros clientes que van desde los grandes y corporativos hasta los pequeños y locales. Esa experiencia la llevó a su actuación más reconocida.
Cuando Bennett grabó la voz de Siri en 2005, no tenía ni idea de que acabaría en el iPhone. La grabó mucho antes de que la empresa que creó Siri fuera comprada por Apple, y ni siquiera supo que era la voz de Siri hasta que el producto debutó en la App Store en 2010 y luego apareció en el iPhone 4S en 2011. Pero por muy perfecto que suene Bennett como Siri, fue un proyecto sorprendentemente difícil capturar su voz.
Cómo se graba un asistente digital como Siri
Siri tiene que ser capaz de decir casi todo en el idioma inglés, y eso llevó mucho trabajo.
«Grabé cuatro horas al día, cinco días a la semana durante el mes de julio», dice Bennett. Para un actor de doblaje, esa carga de trabajo supone un gran esfuerzo. «Es mucho tiempo para estar hablando constantemente. En consecuencia, te cansas».
La Siri original «debía sonar de otro mundo y tener un sentido del humor seco», dice Bennett. Añadió eso a su interpretación del personaje, aunque se centró en mantener la coherencia y la claridad.
La actuación de voz siempre requiere cierta perspicacia técnica: como dice Bennett, se trata de «ser capaz de leer un texto de 65 segundos en 60 segundos». Pero grabar para una voz computarizada como la de Siri es especialmente difícil. Estas sesiones vocales maratonianas no implicaban la lectura de palabras u oraciones completas. En su lugar, grabó la materia prima del habla: los sonidos básicos.
La técnica de utilizar sofisticados programas informáticos para construir palabras y frases a partir de sonidos básicos se denomina habla concatenada (el sitio hermano de Vox, The Verge, describió el proceso de vinculación de esos sonidos en 2013). El objetivo es tratar de incluir todos los sonidos posibles (normalmente extraídos de un bloque de construcción de una sílaba) para que puedan ensamblarse en todas las combinaciones posibles para cada palabra posible.
Para grabarlas, los actores de voz se ven obligados a recitar frases que parecen galimatías y que incluyen todos los diferentes sonidos del idioma inglés.
En su estudio casero, Bennett grabó algunas frases para mí. Había guardado un viejo guión para una voz digital que había hecho antes para Lucent Technologies, que incluía frases absurdas como «aceita hoy la hierba de tus molinos». Bennett lo llama «poesía de voz digital», y te sugiere que te tomes una copa de vino mientras lo escuchas:
El proceso puede llevar un tiempo porque el objetivo es grabar tantas variedades y tipos de sonidos como sea posible, para que el discurso suene mejor y más humano. Por ejemplo, los actores como Bennett no sólo tienen que grabar un sonido «s»: tienen que grabar los distintos sonidos «s» de palabras como «sis», «serpientes» y «rosa». Finalmente, los sonidos son cosidos por un ordenador, con el objetivo de que el sonido sea cada vez más natural.
Bennett cree que probablemente se han incorporado algunas grabaciones nuevas a la versión actual de Siri, para mejorarla y ofrecer más opciones a los usuarios. Eso significa que el asistente digital que escuchas hoy en tu teléfono es probablemente una mezcla de diferentes voces humanas, incluyendo la de Bennett y otras, encadenadas en un programa útil.
La nueva tecnología ha convertido la actuación de voz en un negocio altamente competitivo
Aún así, es más importante que nunca que Bennett pueda decir que fue la voz original de Siri. Sirve como marcador único en un negocio en el que siempre hay nuevos talentos tratando de conseguir el siguiente trabajo. Y ese espíritu competitivo se extiende al estudio casero de Bennett, que daría envidia a cualquier audiófilo.
Está construido sobre pies de goma para absorber el sonido, y ella lo usa todos los días. Hay espuma en la pared, un escritorio con un preamplificador y un mezclador, y un micrófono Neumann TLM 193 (precio medio: 1.599 dólares). Sentada en un taburete ajustable, lee sus guiones en un iPad y tiene un monitor de ordenador para ver cómo va la grabación.
Ha invertido mucho en su estudio porque la mayor parte de sus grabaciones se realizan en casa, algo típico de muchos actores de doblaje. Gracias a las conexiones de alta calidad en todo el mundo -que comenzaron con las líneas RDSI de alta calidad y se extendieron a la actual banda ancha de fibra óptica- es posible que los actores de todo el mundo graben desde casa y compitan entre sí. Como en tantos otros sectores, la tecnología lo ha cambiado todo para los actores de doblaje.
«Puedes elegir un talento de cualquier lugar y grabar a esa persona desde cualquier otro lugar», dice Bennett. «Toda la gente de cualquier ciudad ya no estaba limitada a su grupo local de actores. Podían ir a cualquier parte del mundo»
Instaló su RDSI en 1996, y para seguir siendo competitivos, muchos actores de doblaje hicieron lo mismo. La tecnología ha traído grandes oportunidades al negocio, así como una competencia más dura.
Pero por muy competitiva que sea la locución, las voces siempre serán necesarias
Bennett cuida su voz: bebiendo agua tibia a veces en lugar de té, tomando de vez en cuando un poco de miel y evitando aclarar la garganta.
Pero no hay una estrategia mágica para convertirse en actor de doblaje, porque algo de la voz es innato.
«Creo que las voces son muy personales», dice, «y creo que esa es una de las razones por las que la gente adora a Siri y a todos los demás asistentes digitales, porque aportan un poco de humanidad a toda esta maquinaria con la que estamos tratando».»
Es poco probable que eso cambie, aunque las voces computerizadas sean cada vez más comunes. Hay algo en la voz que no se puede simular. Eso está muy claro cuando hablas con Susan Bennett y la escuchas sonar igual que Siri. Pero es aún más claro cuando rompe el carácter y empieza a reírse.