A Siri valódi hangja elmagyarázza a voiceover művészetét

Ez a cikk eredetileg Phil Edwards tollából jelent meg a VOX-on

Néha nehéz felfogni, hogy a számtalan elektronikus hangot, amit hallunk, az önkiszolgáló pénztárnál megjelenő felszólítástól a telefonunkból érkező testetlen hangig, valódi ember adta. Honnan származnak ezek a hangok? Hogy ezt kiderítsem, megkérdeztem az iPhone asszisztens, Siri eredeti hangját, Susan Bennettet.

Ő egy szinkronszínész, aki az ikonikus iPhone-életművén kívül reklámokat készít, énekel, és számos más vállalatnak és szolgáltatásnak ad hangot. És elmesélte, hogyan is működik az egyedülálló iparág.

Hogyan lett Susan Bennett a Siri eredeti hangja – és mit mond ez a szinkronszínészetről

Susan Bennett az otthoni stúdiójában.
Susan Bennett az otthoni stúdiójában.

Susan Bennett-tel beszélgetni szürreális – az egyik pillanatban teljesen normálisnak tűnik, kivéve, hogy a legkellemesebb hangja van, amit valaha hallottál. De egy pillanat alatt képes bekapcsolni a Siri hangját, és máris azt hiszed, hogy a számítógépeddel beszélgetsz.”

Bennett a vermonti Burlingtonból származik, aki fiatalon New York állam északi részébe költözött, és a háttere semleges amerikai beszédstílust adott neki. Miután színészkedett és énekelt a Brown Egyetemen, a csavaros Atlantába ment, ahol tiszta, ékezet nélküli hangja egyedülálló versenyelőnyhöz juttatta.

Így vagy úgy, de évtizedek óta emberszabásúvá teszi a számítógépeket

A hetvenes években Bennett egy, a Siritől teljesen eltérő számítógép emberszabásúvá tételével tört be a hangszínészetbe: ő énekelte a Tillie the All Time Teller, az egyik első bankautomata jingle-jét. Bennett évtizedeken át rögzítette a narrációt üzenetrögzítő szolgálatok, hangosbeszélő rendszerek és más ügyfelek számára, amelyek a nagy és vállalati cégektől kezdve a kis és helyi vállalkozásokig terjednek. Ez a tapasztalat vezette őt a legfelismerhetőbb fellépéséhez.

Amikor Bennett 2005-ben felvette a Siri hangját, még nem is sejtette, hogy az az iPhone-ban fog kikötni. Még jóval azelőtt rögzítette, hogy a Sirit készítő céget felvásárolta volna az Apple, és nem is tudta, hogy ő a Siri hangja, amíg a termék 2010-ben meg nem jelent az App Store-ban, majd 2011-ben meg nem jelent az iPhone 4S-ben. De amilyen zökkenőmentesen szólal meg Bennett Siri szerepében, olyan meglepően nehéz projekt volt a hangját rögzíteni.

Hogyan készül egy olyan digitális asszisztens, mint Siri felvétele

Sirinek szinte mindent el kell tudnia mondani az angol nyelven, és ez rengeteg kemény munkát igényelt.

“Július hónapban napi négy órát vettem fel, heti öt napon át” – mondja Bennett. Egy szinkronszínész számára ez a munkaterhelés nagy megterhelést jelent. “Ez nagyon hosszú idő ahhoz, hogy folyamatosan beszéljünk. Következésképpen elfáradsz.”

Az eredeti Sirinek “túlvilági hangon és száraz humorérzékkel kellett megszólalnia” – mondja Bennett. Ezt adta hozzá a karakterhez, még akkor is, amikor arra összpontosított, hogy következetes és világos maradjon.”

A hangszínészet mindig igényel némi technikai érzéket – ahogy Bennett mondja, arról van szó, hogy “képes vagy 60 másodperc alatt 65 másodpercnyi szöveget elolvasni”. De egy olyan számítógépes hanghoz, mint a Siri, különösen nehéz felvenni. Ezek a maratoni hangfelvételek nem teljes szavak vagy mondatok felolvasását jelentették. Ehelyett a beszéd alapanyagait – alaphangokat – vette fel.

Az a technika, amelynek során kifinomult számítógépes programok segítségével szavakat és mondatokat építenek fel alaphangokból, az úgynevezett konkatenált beszéd (a Vox testvéroldala, a The Verge 2013-ban írta le e hangok összekapcsolásának folyamatát). A cél az, hogy megpróbáljanak minden lehetséges hangot (általában egy szótag hosszúságú építőkockából merítve) beépíteni, hogy azok minden lehetséges kombinációban összeállíthatók legyenek minden lehetséges szóhoz.

Ezek rögzítéséhez a szinkronszínészeknek olyan halandzsaszerű mondatokat kell elmondaniuk, amelyek az angol nyelv összes különböző hangját tartalmazzák.

Az otthoni stúdiójában Bennett felvett nekem néhány mondatot. Elmentett egy régi forgatókönyvet egy digitális hanghoz, amelyet korábban a Lucent Technologies számára készített, és olyan abszurd mondatokat tartalmazott, mint például “olajozd meg ma a malmok gyomnövényét”. Bennett ezt “digitális hangköltészetnek” nevezi, és azt javasolja, hogy hallgatás közben igyál egy pohár bort:

A folyamat eltarthat egy darabig, mert a cél az, hogy minél többféle és típusú hangot rögzítsünk, hogy minél jobb és emberibb hangzású beszédet kapjunk. Például a Bennetthez hasonló színészeknek nem csak egy “s” hangot kell felvenniük – fel kell venniük a különböző “s” hangokat az olyan szavakban, mint a “hiss”, “kígyó” és “rózsa”. A hangokat végül egy számítógép illeszti össze, a cél az egyre természetesebb hangzás elérése.

Bennett úgy véli, hogy néhány új felvételt valószínűleg azért építettek be a Siri jelenlegi verziójába, hogy javítsák azt, és több lehetőséget biztosítsanak a felhasználók számára. Ez azt jelenti, hogy a digitális asszisztens, amit ma a telefonodon hallasz, valószínűleg különböző emberi hangok, köztük Bennett és mások hangjainak egybegyúrása egyetlen hasznos programba.

Az új technológia a szinkronszínészetet rendkívül versenyképes üzletággá tette

A szinkronszínészekre jellemző a bonyolult otthoni stúdió.

Egy kidolgozott otthoni stúdió jellemző egy szinkronszínészre.

Mégis fontosabb, mint valaha, hogy Bennett elmondhassa magáról, hogy ő volt Siri eredeti hangja. Egyedülálló jelzőként szolgál egy olyan szakmában, ahol mindig új tehetségek próbálják megszerezni a következő fellépést. És ez a versenyszellem kiterjed Bennett otthoni stúdiójára is, amelyet bármelyik audiofil megirigyelhetne.

A stúdió gumilábakon áll, hogy elnyelje a hangokat, és Bennett minden nap használja. A falon habszivacs, egy pult előerősítővel és keverővel, valamint egy Neumann TLM 193 mikrofon (átlagár: 1599 dollár). Egy állítható zsámolyon ülve egy iPadről olvassa fel a forgatókönyveit, és egy számítógépes monitoron látja, hogyan halad a felvétel.

Komoly befektetéseket eszközölt a stúdiójába, mert a felvételek nagy része otthon történik, ami sok szinkronszínészre jellemző. A világméretű, kiváló minőségű kapcsolatoknak köszönhetően – amelyek a kiváló minőségű ISDN-vonalakkal kezdődtek, és a mai üvegszálas szélessávú internetkapcsolatokig terjednek – a színészek számára világszerte lehetővé vált, hogy otthonról rögzítsenek és versenyezzenek egymással. Mint oly sok iparágban, a technológia a szinkronszínészek számára is mindent megváltoztatott.

“Bárhonnan választhatsz egy tehetséget, és bárhol máshol felveheted az illetőt” – mondja Bennett. “Az összes ember bármelyik városból többé nem korlátozódott a helyi színészcsoportra. Bárhová mehettek a világon.”

Az ISDN-t 1996-ban telepítette, és hogy versenyképes maradjon, sok szinkronszínész is így tett. A technológia nagy lehetőségeket hozott a szakmának, és keményebb versenyt is.

De bármennyire is versenyképes a szinkronszínészet, a hangokra mindig szükség lesz

Siri, készséggel válaszol a kérdésekre 2011.

Hadrian/

Siri, készen áll, hogy válaszoljon a kérdéseitekre 2011-ben.

Bennett vigyáz a hangjára: tea helyett néha langyos vizet iszik, időnként mézet iszik, és kerüli a torokköszörülést.

De nincs varázstratégia a hangszínésszé váláshoz, mert valami a hanggal kapcsolatban veleszületett.

“A DIGITÁLIS ASSZISZTENSEK egy kis emberséget visznek ebbe a sok gépezetbe, amivel foglalkozunk”

“Szerintem a hangok nagyon személyesek” – mondja – “és szerintem ez az egyik oka annak, hogy az emberek szeretik Sirit és az összes többi digitális asszisztenst, mert egy kis emberséget visznek ebbe a sok gépezetbe, amivel foglalkozunk.”

Ez valószínűleg nem fog változni, még akkor sem, ha a számítógépes hangok egyre gyakoribbá válnak. Van valami a hangban, amit nem lehet szimulálni. Ez világosan látszik, amikor Susan Bennett-tel beszélsz, és azt hallod, hogy pont úgy beszél, mint Siri. De még világosabb, amikor kitör a szerepéből, és nevetni kezd.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük