هوش مصنوعیتکنولوژی

هوش مصنوعی جدید انویدیا که میتونی با اون آهنگ بسازی

شرکت انویدیا مدل هوش مصنوعی جدید خود با نام «فوگاتو» (Fugatto) را معرفی کرد که قادر است به پیام‌های متنی صدا ببخشد و همچنین فایل‌های صوتی موجود را تغییر دهد.

این مدل، که به طور رسمی با نام Foundational Generative Audio Transformer Opus 1 شناخته می‌شود، توسط تیمی از محققان بین‌المللی طراحی شده و به عنوان یک مدل هوش مصنوعی جامع در زمینه صوت و صدا معرفی شده است. فوگاتو قادر است دستورالعمل‌های متنی را دریافت کرده و از آنها برای تولید موسیقی، تغییر صداها یا تغییر فایل‌های صوتی استفاده کند.

انویدیا اعلام کرده است که قابلیت‌های چندلهجه‌ای و چندزبانه این مدل، آن را بسیار قدرتمند کرده است. رافائل واله، یکی از محققان پروژه و مدیر تحقیقات صوتی کاربردی در انویدیا، می‌گوید: «هدف ما این بود که مدلی ایجاد کنیم که توانایی درک و تولید صدا را به همان شیوه انسان‌ها داشته باشد.»

فوگاتو

انویدیا همچنین به برخی کاربردهای بالقوه این مدل در دنیای واقعی اشاره کرده است. برای مثال، تولیدکنندگان موسیقی می‌توانند از فوگاتو برای تولید سریع پیش‌نمونه‌ای از یک ایده آهنگ استفاده کنند و سپس آن را به راحتی ویرایش کرده و صداها، سبک‌ها و سازهای مختلف را آزمایش کنند. افراد عادی نیز می‌توانند از این مدل برای تولید محتوای صوتی در ابزارهای یادگیری زبان با صدای دلخواه خود بهره‌برداری کنند. علاوه بر این، توسعه‌دهندگان بازی‌های ویدئویی می‌توانند از فوگاتو برای تغییر محتوای صوتی از پیش ضبط‌شده و تطبیق آن با تغییرات در بازی بر اساس انتخاب‌ها و اقدامات بازیکنان استفاده کنند.

محققان همچنین دریافته‌اند که این مدل قادر است برخی وظایف پیچیده‌ای را که جزو پیش‌آموزش‌های اولیه آن نبوده است با تنظیمات دقیق انجام دهد. به عنوان مثال، فوگاتو می‌تواند صدای گفتاری با لهجه خاص یا صداهایی مانند آواز پرندگان در طوفان و رعد و برق تولید کند. این مدل حتی قادر است صداهایی را ایجاد کند که در طول زمان تغییر می‌کنند، مانند صدای بارش باران طوفانی که شدت آن به تدریج افزایش می‌یابد.

اگرچه هنوز خبری از دسترسی عمومی به فوگاتو منتشر نشده است، اما این مدل اولین فناوری هوش مصنوعی مولدی نیست که قادر به ایجاد صدا از متن است. پیش از این، شرکت متا یک مدل هوش مصنوعی منبع‌باز برای تولید صدا از توضیحات متنی منتشر کرده است. همچنین گوگل هوش مصنوعی MusicLM را معرفی کرده است که می‌تواند متن را به موسیقی تبدیل کند و افراد می‌توانند از طریق وب‌سایت AI Test Kitchen به آن دسترسی داشته باشند.

منبع ایسنا

نوشته های مشابه

دکمه بازگشت به بالا