هوش مصنوعی جدید انویدیا که میتونی با اون آهنگ بسازی
شرکت انویدیا مدل هوش مصنوعی جدید خود با نام «فوگاتو» (Fugatto) را معرفی کرد که قادر است به پیامهای متنی صدا ببخشد و همچنین فایلهای صوتی موجود را تغییر دهد.
این مدل، که به طور رسمی با نام Foundational Generative Audio Transformer Opus 1 شناخته میشود، توسط تیمی از محققان بینالمللی طراحی شده و به عنوان یک مدل هوش مصنوعی جامع در زمینه صوت و صدا معرفی شده است. فوگاتو قادر است دستورالعملهای متنی را دریافت کرده و از آنها برای تولید موسیقی، تغییر صداها یا تغییر فایلهای صوتی استفاده کند.
انویدیا اعلام کرده است که قابلیتهای چندلهجهای و چندزبانه این مدل، آن را بسیار قدرتمند کرده است. رافائل واله، یکی از محققان پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، میگوید: «هدف ما این بود که مدلی ایجاد کنیم که توانایی درک و تولید صدا را به همان شیوه انسانها داشته باشد.»
انویدیا همچنین به برخی کاربردهای بالقوه این مدل در دنیای واقعی اشاره کرده است. برای مثال، تولیدکنندگان موسیقی میتوانند از فوگاتو برای تولید سریع پیشنمونهای از یک ایده آهنگ استفاده کنند و سپس آن را به راحتی ویرایش کرده و صداها، سبکها و سازهای مختلف را آزمایش کنند. افراد عادی نیز میتوانند از این مدل برای تولید محتوای صوتی در ابزارهای یادگیری زبان با صدای دلخواه خود بهرهبرداری کنند. علاوه بر این، توسعهدهندگان بازیهای ویدئویی میتوانند از فوگاتو برای تغییر محتوای صوتی از پیش ضبطشده و تطبیق آن با تغییرات در بازی بر اساس انتخابها و اقدامات بازیکنان استفاده کنند.
محققان همچنین دریافتهاند که این مدل قادر است برخی وظایف پیچیدهای را که جزو پیشآموزشهای اولیه آن نبوده است با تنظیمات دقیق انجام دهد. به عنوان مثال، فوگاتو میتواند صدای گفتاری با لهجه خاص یا صداهایی مانند آواز پرندگان در طوفان و رعد و برق تولید کند. این مدل حتی قادر است صداهایی را ایجاد کند که در طول زمان تغییر میکنند، مانند صدای بارش باران طوفانی که شدت آن به تدریج افزایش مییابد.
اگرچه هنوز خبری از دسترسی عمومی به فوگاتو منتشر نشده است، اما این مدل اولین فناوری هوش مصنوعی مولدی نیست که قادر به ایجاد صدا از متن است. پیش از این، شرکت متا یک مدل هوش مصنوعی منبعباز برای تولید صدا از توضیحات متنی منتشر کرده است. همچنین گوگل هوش مصنوعی MusicLM را معرفی کرده است که میتواند متن را به موسیقی تبدیل کند و افراد میتوانند از طریق وبسایت AI Test Kitchen به آن دسترسی داشته باشند.
منبع ایسنا