گفتوگو با «سوزان بنت» شما را شگفتزده می کند. او در عین حال که می تواند بسیار عادی و معمولی صحبت کند ناگهان هم می تواند صدای خود را به صدایی که همه ما در دستیار صوتی Siri شنیده ایم تغییر دهد و شما تصور می کنید دارید با کامپیوتر صحبت می کنید.
«سوزان بنت» در برلینگتن کانادا به دنیا آمد اما وقتی خیلی جوان بود به نیویورک نقل مکان کرد. حضور او در نیویورک باعث شد که او سبک گفتاری آمریکایی داشته باشد. او در دانشگاه Brown آواز و بازیگری را فراگرفت و بعد به آتلانتا رفت جایی که صدای بدون لهجه اش فرصتهای مناسبی را برای کار برایش فراهم کرد.
در دهه ۱۹۷۰ صدای «سوزان بنت» نخستین بار روی سیستم صوتی دستگاههای ATM قرار گرفت و برای چند دهه صدای خاص او روی سرویسهای پاسخ دهی خودکار صوتی، سیستمهای PA و… قرار گرفته است. در سال ۲۰۰۵ وقتی «سوزان بنت» برای Siri صدای خود را ضبط میکرد هیچ ایده ای از اینکه قرار است بعدا صدای او روی میلیونها آیفون قرار بگیرد نداشت.
در واقع هنوز حتی آیفونی به وجود نیامده بود. (سیری نخستین بار بهصورت اپلیکیشن روی فروشگاه نرم افزار اپل قرار گرفت و در سال ۲۰۱۰ توسط اپل خریده شد). او حتی تا سال ۲۰۱۱ که برای نخستین بار Siri روی آیفون ۴S عرضه شد نمیدانست که صدای او روی این سرویس قرار دارد.
Siri باید قادر باشد هر چیزی را به زبان انگلیسی بگوید. «سوزان بنت» میگوید: طی ماه جولای من چهارساعت در روز و در پنج روز هفته مشغول ضبط Siri بودم. این زمان برای یک صدا پیشه زمان زیادی است، چراکه شما در یک مدت طولانی و مداوم باید صحبت کنید و این شما را خسته میکند.
در عین حال لحن صدای Siri یک حالت شوخ طبعانه هم دارد. به گفته «سوزان بنت» این صدا باید یک کاراکتر خاص خود را میداشت و من یک حالت شوخ طبعی به آن اضافه کردم و این در عین استواری و وضوحی بود که باید در بیان کلمات بهکار برده می شد.
صداپیشگی به گفته «سوزان بنت» نیازمند نوعی هوشمندی تکنیکی هم هست چیزی که به گفته او متنی که ۶۵ ثانیه قابل خواندن است را باید طی ۶۰ ثانیه گفت، اما موضوع سیری از این هم سخت تر بود. ضبط صدا برای این کاربرد کامپیوتری به شیوه ادای همه کلمات و جملات موجود در زبان انگلیسی نبود و به جای آن او باید صداهای پایه را بیان میکرد.
برای ضبط، صداپیشه باید انواع جملات ناتمام را با تمام آواهای مختلف زبان انگلیسی بیان کند. این موضوع باعث میشودکه زمان زیادی گرفته شود، چراکه صداپیشه باید یک جمله را با انواع و اقسام آواها بیان کند تا نتیجه کار به صدای انسانی بیشتر شبیه شود.
بهعنوان مثال صدا پیشه باید در کلماتی مانند «hiss»،«snakes»، یا «rose» حرف S را با آواهای مختلف بیان کند. بقیه کار ترکیب توسط کامپیوتر انجام میشود. «سوزان بنت» اما حالا معتقد است صدای Siri نیاز به یک ضبط جدید دارد تا بتوان آن را بهبود داد، البته اپل نشان داده به مرور زمان توانسته با استفاده از بهبودهای نرم فزاری و تکنیک های دیگر به صدای Siri آن را بیشتر شبیه زبان انسان کند.
نکته قابل توجه در مورد «سوزان بنت» این است که او کار ضبط صدا و کارهای مرتبط با آن را در استودیوی خانگی خود انجام می دهد. جایی که هزینه تجهیزات آن هم بسیار بالا بوده است.