この記事は、VOXのPhil Edwardsによって掲載されました
セルフレジでの案内から携帯電話から聞こえる実体のない音まで、我々が聞く無数の電子音声が、本物の人間によって提供されていることに感謝することが難しいときがあります。 その声はどこから来るのだろう?
彼女は声優であり、iPhone を象徴する作品に加え、多くの企業やサービスのためにコマーシャルや歌、音声を提供している人物です。
スーザン・ベネットはいかにして Siri のオリジナル音声になったのか – そしてそれは声優について何を語っているのか
Susan Bennettとの会話はシュールです。ある瞬間、彼女はまったく普通に聞こえ、聞いたこともないほど心地よい声をしていることを除いては。
バーモント州バーリントン出身のベネットは、若い頃にニューヨーク州北部に移り住み、その背景からニュートラルなアメリカ的話し方をするようになりました。
いずれにせよ、彼女は何十年もの間、コンピュータを人間らしくしてきました
1970年代、ベネットは Siri とはまったく異なるコンピュータを人間らしくすることで声優の世界に入り、最初の ATM の 1 つである Tillie the All Time Teller のジングルを歌いました。 数十年にわたり、ベネットは留守番電話サービスやPAシステムなど、大企業から小規模な地元企業まで、さまざまなクライアントのナレーションを録音してきました。
2005年にBennett氏がSiriの音声を録音したとき、それがiPhoneに搭載されるとは思いもよりませんでした。 また、2010 年に App Store でデビューし、2011 年に iPhone 4S に搭載されるまで、自分が Siri の声であることすら知りませんでした。
Siriのようなデジタル アシスタントはどのように録音されるか
Siriは、英語でほぼすべてのことを言えるようにする必要があり、それには大変な苦労がありました。
「7月の1カ月間、1日に4時間、週に5日録音しました」とBennett氏は述べています。
「7月の1ヶ月間、1日4時間、週5日録音しました」とBennett氏は言います。「声優にとって、この仕事量は大きな負担です。
「7月の1ヶ月間、1日4時間、週5日録音しました。
オリジナルのSiriは、「別世界のような声で、乾いたユーモアのセンスを持っていました」とBennett氏は言います。
声優には常に技術的な洞察力が求められます。ベネットが言うように、「65 秒分の原稿を 60 秒で読むことができる」ことが重要なのです。 しかし、Siri のようなコンピュータ音声の録音は、特に困難です。 しかし、Siriのようなコンピューター音声の録音は特に難しい。
高度なコンピューター プログラムを使用して基本音から単語や文章を構築する技術は、連結音声と呼ばれています (Vox の姉妹サイト The Verge では、2013 年にこれらの音を連結するプロセスについて説明しています)。
これを記録するために、声優は、英語のさまざまな音をすべて含む、ちんぷんかんぷんな文章を暗唱させられます。
彼女の自宅スタジオで、Bennett氏はいくつかのフレーズを記録してくれました。
自宅のスタジオで、ベネットはいくつかのフレーズを録音してくれました。彼女は以前ルーセントテクノロジーのために行ったデジタル音声用の古い台本を保存しており、そこには “oil your mills jewel weed today” などのばかげたフレーズも含まれていました。 Bennett はこれを「デジタル音声詩」と呼び、ワインを飲みながら聞くことを勧めています。
このプロセスは、より良い、より人間らしい音声を作るために、できるだけ多くの種類とタイプの音を録音することが目的なので、しばらく時間がかかることがあります。 たとえば、Bennett のような俳優は、単に「s」の音を録音するだけでなく、「hiss」、「snakes」、「rose」といった単語のさまざまな「s」の音を録音する必要があるのです。
ベネットは、Siriを改善し、ユーザーにより多くの選択肢を提供するために、いくつかの新しい録音が現在のバージョンに組み込まれたのではないかと考えています。
新しいテクノロジーは、声優を競争の激しいビジネスに変えました
それでも、ベネットが Siri のオリジナルの声だと言えることは、これまで以上に重要なことなのです。 常に新しい才能が次の仕事を得ようとするビジネスにおいて、ユニークな目印となります。
音を吸収するためにゴム足で作られたスタジオで、彼女は毎日それを使っています。
音を吸収するためのゴム足があり、彼女は毎日それを使っています。壁には泡があり、プリアンプとミキサーのある机、そしてNeumann TLM 193マイク(平均価格1,599ドル)が置かれています。
彼女がスタジオに真剣に投資したのは、多くの声優がそうであるように、彼女の録音の大部分は自宅で行われるからです。 高品質の ISDN 回線から始まり、今日の光ファイバーによるブロードバンドに至るまで、世界的な高品質回線のおかげで、世界中の俳優が自宅で録音し、互いに競争することが可能になっています。 多くの業界と同様に、テクノロジーは声優のすべてを変えました。
「どこからでもタレントを選び、どこからでもその人を録音できるようになりました」と、Bennett 氏は言います。
「どこからでもタレントを選び、どこからでもその人を録音することができます。
彼女は 1996 年に ISDN を導入し、競争力を維持するために、多くの声優が同じことをしました。
しかし、ボイスオーバーが競争的であるのと同様に、声は常に必要です
ベネットは、お茶ではなく時々ぬるま湯を飲み、時々蜂蜜を食べ、喉を鳴らさないよう、声のケアに気をつけているそうです。
しかし、声優になるための魔法のような戦略はないのです。
「声はとても個人的なものだと思います」と彼女は言います。そして、それが人々が Siri や他のすべてのデジタル アシスタントを愛する理由の 1 つだと思います。 声に関する何かは、シミュレーションできません。 スーザン・ベネットに話しかけ、Siri のような声を聞けば、それは非常に明らかです。 しかし、彼女がキャラクターを壊して笑い出すと、さらにはっきりするのです。