ترجمه همزمان با هوش مصنوعی meta، مترجم‌ها را بیکار می‌کند

در ماه مرداد، meta از مدل ترجمه چندوجهی هوش مصنوعی خود، SeamlessM4T ، رونمایی کرد که از نزدیک به ۱۰۰ زبان برای متن و ۳۶ زبان برای گفتار پشتیبانی می‌کند. با معماری به روز شده v2، غول فناوری اکنون در حال توسعه این فناوری است تا ترجمه های محاوره ای را راحت تر و گویاتر کند – که دومی کلید گم شده ای برای مکالمه معتبر بین زبان هاست.

اولین مورد از دو ویژگی جدید SeamlessExpressive است که، همانطور که از نامش می توانید تشخیص دهید، عبارات شما را به گفتار ترجمه شده شما منتقل می کند. اینها شامل زیر و بمی صدا، صدا، لحن عاطفی (هیجان، غم یا زمزمه)، سرعت گفتار و مکث می شود.

با در نظر گرفتن اینکه چگونه حرف ها ترجمه شده تا به حال همیشه روباتیک و مصنوعی به نظر می‌رسیدند، این پیشرفت به طور بالقوه یک تغییر بزرگ است – هم در زندگی روزمره ما و هم در تولید محتوا. زبان‌های پشتیبانی‌شده عبارتند از انگلیسی، اسپانیایی، آلمانی، فرانسوی، ایتالیایی و چینی، اگرچه در زمان نگارش این مقاله، صفحه نمایشی ایتالیایی و چینی وجود ندارد.

ویژگی دوم «SeamlessStreaming» است که شروع به ترجمه یک سخنرانی در حالی که گوینده هنوز در حال صحبت است، می کند، بنابراین به دیگران امکان می دهد ترجمه را سریعتر بشنوند. هنوز یک تأخیر کوتاه و کمتر از دو ثانیه وجود دارد، اما حداقل لازم نیست منتظر بمانید تا کسی جمله را تمام کند.

به گفته meta ، چالش اینجاست که زبان‌های مختلف ساختار جمله‌ای متفاوتی دارند، بنابراین مجبور شد الگوریتمی را برای مطالعه ورودی جزئی صوتی ایجاد کند تا تصمیم بگیرد که آیا زمینه کافی برای شروع تولید یک خروجی ترجمه شده وجود دارد یا اینکه آیا به گوش دادن ادامه می‌دهد. .

به نظر می رسد آخرین توسعه meta در این مجموعه ارتباطات بدون درز تاثیرگذار باشد – بیشتر از ابزارهای مترجم موبایل ارائه شده توسط شرکت هایی مانند گوگل و سامسونگ . هیچ صحبتی در مورد اینکه چه زمانی عموم مردم قادر به استفاده از این ویژگی های جدید خواهند بود وجود ندارد، اما من می توانم تصور کنم که متا روزی آنها را در عینک های هوشمند خود بپزد و آنها را حتی کاربردی تر از همیشه کند.

منبع: ایروتایم

مطالب مرتبط