هوش مصنوعی

OpenAI از نسل جدید هوش مصنوعی ویدیوساز خود، Sora 2، با قابلیت تولید صدای طبیعی رونمایی کرد

شرکت OpenAI از مدل ویدیوساز پیشرفته Sora 2 رونمایی کرد. این مدل از نظر دقت فیزیکی، واقع‌گرایی و کنترل‌پذیری نسبت به نسخه‌های قبلی بهبود یافته و قابلیت پشتیبانی از دیالوگ و جلوه‌های صوتی هماهنگ با تصویر را داراست.

رونمایی از مدل هوش مصنوعی ویدیوساز پیشرفته OpenAI Sora 2

بر اساس اطلاعات وب‌سایت OpenAI، این شرکت عرضه نسخه اول Sora را با عرضه GPT-1 و معرفی Sora 2 را با عرضه GPT-3.5 مقایسه کرده است که تحول بزرگی به حساب می‌آید. سازنده ChatGPT اعلام کرده است که Sora 2 قادر است وظایفی را انجام دهد که برای مدل‌های قبلی بسیار دشوار یا حتی غیرممکن بود.

مدل‌های قبلی به شکلی ساده‌انگارانه عمل می‌کردند و برای اجرای دستورات متنی، واقعیت را تغییر می‌دادند. مثلاً اگر یک بازیکن بسکتبال نمی‌توانست توپ را داخل حلقه بیندازد، توپ ممکن بود به طور غیرواقعی داخل حلقه «تله‌پورت» شود. اما در Sora 2، اگر شوت خطا برود، توپ به تخته پشت حلقه برخورد می‌کند و رفتار طبیعی‌تری دارد.

OpenAI اعلام کرده است که هرچند Sora 2 هنوز نقص‌هایی دارد، اما به طور قابل‌توجهی بهتر از قبل از قوانین فیزیک پیروی می‌کند. این پیشرفت گامی مهم در مسیر ساخت شبیه‌سازهای واقع‌گرایانه است، چرا که برای رسیدن به موفقیت باید هم از پیروزی‌ها و هم از شکست‌ها درس گرفت.

مدل هوش مصنوعی ویدیوساز Sora 2 جهش بزرگی در کنترل‌پذیری داشته است. این مدل قادر است به دستورالعمل‌های دقیق برای چندین شات پایبند باشد و در عین حال ثبات جهان تصویری را حفظ کند. نسخه جدید OpenAI در زمینه واقع‌گرایی و خلق تصاویر سینمایی و انیمه‌ای عملکردی چشمگیر دارد.

Sora 2 به‌عنوان یک سیستم جامع تولید ویدیو و صدا، قادر است اصوات پس‌زمینه پیچیده، گفتار طبیعی و جلوه‌های صوتی واقع‌گرایانه را با کیفیت بالا ایجاد کند.

همچنین می‌توان عناصر دنیای واقعی را مستقیماً در Sora 2 وارد کرد. برای مثال، OpenAI اعلام کرده است که این مدل پس از مشاهده ویدیویی از یکی از اعضای تیم، توانسته آن فرد را در هر محیطی که خلق می‌کند، با جلوه‌های بصری و صوتی دقیق بازسازی کند.

OpenAI هم‌زمان با معرفی Sora 2، اپلیکیشن جدیدی به نام Sora عرضه کرده است که امکان ساخت، ترکیب و اشتراک‌گذاری ویدیوها را فراهم می‌کند. کاربران می‌توانند تصاویر خود یا دوستانشان را به ویدیوها اضافه کنند و ویدیوهای سایر کاربران را نیز مشاهده کنند.

اپلیکیشن Sora برای iOS هم‌اکنون در دسترس است، اما کاربران باید در فهرست انتظار ثبت‌نام کنند. این برنامه فعلاً فقط برای کاربران ایالات متحده و کانادا عرضه شده است. مدل Sora 2 به زودی به‌صورت رایگان با برخی محدودیت‌ها در دسترس همه قرار خواهد گرفت و کاربران ChatGPT Pro نیز به نسخه آزمایشی با کیفیت بالاتر Sora 2 Pro در سایت Sora.com دسترسی خواهند داشت.

منبع: دیجیاتو

نوشته های مشابه

دکمه بازگشت به بالا