صدای هوش مصنوعی غیرقابل تشخیص از صدای انسان شد

تا همین اواخر، صدای هوش مصنوعی برای ما همیشه رباتیک و بیروح بود، مثل سیری یا الکسا. اما تحقیق جدیدی نشان میدهد که این دوره به پایان رسیده و حالا شنونده عادی نمیتواند بین صدای واقعی انسان و صدای ساختهشده توسط هوش مصنوعی (دیپفیک) تفاوتی قائل شود.
به گزارش لایوساینس، محققان دانشگاه کوئین مری لندن از شرکتکنندگان خواستند به ۸۰ نمونه صوتی گوش دهند و واقعی یا ساختگی بودن آنها را تشخیص دهند. نتایج بسیار نگرانکننده بود.
وقتی هوش مصنوعی صدایی جدید تولید میکرد، شرکتکنندگان حدود ۵۹ درصد مواقع قادر به تشخیص صحیح بودند. اما وقتی هوش مصنوعی صدای واقعی انسان را کلون میکرد، شرایط تغییر کرد؛ در این حالت ۵۸ درصد شرکتکنندگان صدای جعلی را بهاشتباه واقعی میپنداشتند. کسانی که صدای هوش مصنوعی را درست تشخیص میدادند نیز از نظر آماری فراتر از حد حدس زدن عمل نکردند.
غیرقابل تشخیص شدن صدای هوش مصنوعی از صدای انسان
توانایی هوش مصنوعی در تقلید دقیق صدای انسان، پیامدهای جدی امنیتی، اخلاقی و حقوقی دارد. این فناوری میتواند به ابزار خطرناکی در دست کلاهبرداران تبدیل شود و نمونههای واقعی سوءاستفاده از آن همین حالا نیز مشاهده میشود.
خلافکاران با تقلید صدای شما میتوانند پروتکلهای احراز هویت صوتی بانکی را دور بزنند یا با اعضای خانواده تماس گرفته و با ساختگینمایی یک وضعیت اضطراری از آنها اخاذی کنند. برای مثال پروندهای وجود دارد که در آن زنی به نام «شارون برایتول» پس از شنیدن صدای جعلی دخترش ۱۵ هزار دلار از دست داد.
همچنین این فناوری میتواند برای ساخت مصاحبهها یا بیانیههای جعلی از سیاستمداران و چهرههای عمومی بهکار رود و اعتبار آنها را خراب یا آشوب اجتماعی ایجاد کند. مثلاً موردی گزارش شده که صدای کلونشده نخستوزیر ایالت کوئینزلند برای تبلیغ یک کلاهبرداری بیتکوین استفاده شد.
نگرانکنندهترین نکته سادگی و دسترسی گسترده این فناوری است: پژوهشگران میگویند کلونهای صوتی استفادهشده با نرمافزارهای تجاری در دسترس و تنها با چند دقیقه نمونه صوتی، اندکی دانش فنی و عملاً بدون هزینه ساخته شدهاند، یعنی این ابزار اکنون در دسترس هر کسی است.
یافتههای این تحقیق در ژورنال PLoS One انتشار یافته است.
منبع: دیجیاتو