Skutečný hlas Siri vysvětluje umění voiceoveru

Tento článek původně publikoval Phil Edwards na serveru VOX

Někdy je těžké ocenit, že nespočet elektronických hlasů, které slyšíme, od výzvy u samoobslužné pokladny až po odosobněný tón vycházející z našich telefonů, obstaral skutečný člověk. Odkud se tyto hlasy berou? Abych to zjistil, zeptal jsem se Susan Bennettové, původní hlasové představitelky asistentky Siri pro iPhone.

Je to hlasová herečka, která kromě své ikonické tvorby pro iPhone natáčí reklamy, zpívá a poskytuje hlasy pro mnoho dalších společností a služeb. A vysvětlila, jak její jedinečné odvětví funguje.

Jak se Susan Bennettová stala původním hlasem Siri – a co to vypovídá o hlasovém herectví

Susan Bennettová ve svém domácím studiu.
Susan Bennettová ve svém domácím studiu

Mluvit se Susan Bennettovou je neskutečné – v jednu chvíli zní úplně normálně, jenže má ten nejpříjemnější hlas, jaký jste kdy slyšeli. V mžiku však dokáže zapnout hlas Siri a vy si začnete myslet, že mluvíte se svým počítačem.

Bennettová pochází z Burlingtonu ve Vermontu, v mládí se přestěhovala do státu New York a její původ jí dal neutrální americký styl mluvy. Po herectví a zpěvu na Brownově univerzitě odešla do twangové Atlanty, kde jí její čistý, nepřízvučný hlas poskytl jedinečnou konkurenční výhodu.

Ať tak či onak, počítače polidšťuje už desítky let

V sedmdesátých letech Bennettová prorazila v hlasovém herectví tím, že polidštila úplně jiný počítač než Siri, když nazpívala znělku pro Tillie the All Time Teller, jeden z prvních bankomatů. Po celá desetiletí Bennett nahrával vyprávění pro záznamníky, ozvučovací systémy a další klienty, od velkých a firemních až po malé a místní. Tyto zkušenosti ji dovedly k jejímu nejznámějšímu vystoupení.

Když Bennettová v roce 2005 nahrála hlas pro Siri, netušila, že se nakonec objeví v iPhonu. Nahrála ho mnohem dříve, než společnost, která Siri vytvořila, koupil Apple, a nevěděla ani, že je hlasem Siri, dokud tento produkt v roce 2010 nedebutoval v App Store a poté se v roce 2011 neobjevil na iPhonu 4S. Ale jakkoli bezproblémově Bennettová jako Siri zní, zachytit její hlas byl překvapivě náročný projekt.

Jak se nahrává digitální asistentka, jako je Siri

Siri musí umět říct téměř vše v anglickém jazyce, a to si vyžádalo spoustu tvrdé práce.

„Nahrávala jsem čtyři hodiny denně, pět dní v týdnu po dobu měsíce července,“ říká Bennettová. Pro hlasového herce taková pracovní zátěž znamená velké vypětí. „To je dlouhá doba na to, abyste neustále mluvili. V důsledku toho se unavíte.“

Původní Siri „měla znít nadpozemsky a mít suchý smysl pro humor,“ říká Bennett. Ten ke svému pojetí postavy přidala, i když se soustředila na to, aby zůstala konzistentní a srozumitelná.

Hlasové herectví vždy vyžaduje určitou technickou zdatnost – jak říká Bennettová, jde o to „umět přečíst 65 vteřin textu za 60 vteřin“. Ale nahrávání pro počítačový hlas, jako je Siri, je obzvlášť obtížné. Tyto hlasové maratony nezahrnovaly čtení celých slov nebo vět. Místo toho nahrávala suroviny pro řeč – základní zvuky.

Technice, při níž se pomocí sofistikovaných počítačových programů sestavují slova a věty ze základních zvuků, se říkákonkatenovaná řeč (sesterský web Voxu The Verge popsal proces spojování těchto zvuků v roce 2013). Cílem je pokusit se zahrnout všechny možné zvuky (obvykle vycházející ze slabikotvorných stavebních prvků), aby je bylo možné sestavit ve všech možných kombinacích pro všechna možná slova.

Pro jejich nahrávání jsou hlasoví herci nuceni odříkávat věty podobné blábolům, které obsahují všechny různé zvuky anglického jazyka.

Bennettová pro mě ve svém domácím studiu nahrála několik vět. Měla uložený starý scénář pro digitální hlas, který dříve vytvořila pro společnost Lucent Technologies, včetně absurdních frází jako „naolejuj dnes svůj mlýnský šperk plevelem“. Bennettová tomu říká „digitální hlasová poezie“ a doporučuje vám, abyste si při poslechu dali sklenku vína:

Proces může chvíli trvat, protože cílem je nahrát co nejvíce druhů a typů zvuků, aby řeč zněla lépe a lidštěji. Například herci jako Bennett nepotřebují nahrát pouze zvuk „s“ – musí nahrát různé zvuky „s“ ve slovech jako „sykavky“, „hadi“ a „růže“. Nakonec jsou tyto zvuky počítačem spojeny dohromady s cílem dosáhnout stále naturalističtějšího zvuku.

Bennett se domnívá, že některé nové nahrávky byly pravděpodobně začleněny do současné verze Siri, aby ji vylepšily a poskytly uživatelům více možností. To znamená, že digitální asistent, kterého dnes slyšíte v telefonu, je pravděpodobně směsicí různých lidských hlasů, včetně Bennettova a dalších, poskládaných do jednoho užitečného programu.

Nové technologie udělaly z hlasového herectví vysoce konkurenční byznys

Pro hlasového herce je typické propracované domácí studio.

Pro hlasového herce je typické propracované domácí studio

Přesto je důležitější než kdy jindy, aby Bennettová mohla říct, že byla původním hlasem Siri. Slouží jako jedinečná značka v oboru, kde se stále objevují nové talenty, které se snaží získat další zakázku. A tento soutěživý duch se vztahuje i na Bennettové domácí studio, které by jí mohl závidět kdejaký audiofil.

Je postaveno na gumových nožičkách, aby pohlcovalo zvuk, a ona ho používá každý den. Na stěnách je pěna, stůl s předzesilovačem a mixážním pultem a mikrofon Neumann TLM 193 (průměrná cena: 1 599 dolarů). Sedí na nastavitelné stoličce, čte si scénáře z iPadu a má k dispozici monitor počítače, aby viděla, jak nahrávání probíhá.

Do svého studia vážně investovala, protože většina jejího nahrávání probíhá doma, což je typické pro mnoho hlasových herců. Díky celosvětově kvalitnímu připojení – které začalo kvalitními linkami ISDN a rozšířilo se až k dnešnímu optickému širokopásmovému připojení – je možné, aby herci po celém světě nahrávali z domova a vzájemně si konkurovali. Stejně jako v mnoha jiných odvětvích i pro hlasové herce technologie vše změnila.

„Můžete si vybrat talent odkudkoli a nahrávat ho odkudkoli,“ říká Bennett. „Všichni lidé z jakéhokoli města už nebyli omezeni na svou místní skupinu herců. Mohli se vydat kamkoli na světě.“

V roce 1996 si nainstalovala ISDN, a aby si udržela konkurenceschopnost, mnoho hlasových herců udělalo totéž. Technologie přinesly do oboru velké možnosti a také tvrdší konkurenci.

Ale jakkoli je hlasový projev konkurenční, hlasy budou vždy potřeba

Siri, připravena odpovídat na vaše otázky v roce 2011.

Hadrian/

Siri, připravena odpovídat na vaše otázky v roce 2011.

Bennett o svůj hlas pečuje: místo čaje občas pije vlažnou vodu, občas si dá trochu medu a vyhýbá se čištění hrdla.

Neexistuje však žádná kouzelná strategie, jak se stát hlasovým hercem, protože něco v hlase je vrozené.

„DIGITÁLNÍ ASISTENTI PŘINÁŠEJÍ KUS LIDSKOSTI DO VŠECH TĚCH STROJŮ, S KTERÝMI SE OBCHÁZÍME“

„Myslím, že hlasy jsou velmi osobní,“ říká, „a myslím, že to je jeden z důvodů, proč lidé milují Siri a všechny ostatní digitální asistenty, protože přinášejí trochu lidskosti do všech těch strojů, s nimiž máme co do činění.“

To se pravděpodobně nezmění, ani když se počítačové hlasy stanou běžnějšími. Něco na hlase se nedá nasimulovat. To je zcela jasné, když mluvíte se Susan Bennettovou a slyšíte ji znít stejně jako Siri. Ale ještě zřetelnější je to, když se přeruší a začne se smát.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *