OpenAI از نسل جدید هوش مصنوعی ویدیوساز خود، Sora 2، با قابلیت تولید صدای طبیعی رونمایی کرد

شرکت OpenAI از مدل ویدیوساز پیشرفته Sora 2 رونمایی کرد. این مدل از نظر دقت فیزیکی، واقعگرایی و کنترلپذیری نسبت به نسخههای قبلی بهبود یافته و قابلیت پشتیبانی از دیالوگ و جلوههای صوتی هماهنگ با تصویر را داراست.
رونمایی از مدل هوش مصنوعی ویدیوساز پیشرفته OpenAI Sora 2
بر اساس اطلاعات وبسایت OpenAI، این شرکت عرضه نسخه اول Sora را با عرضه GPT-1 و معرفی Sora 2 را با عرضه GPT-3.5 مقایسه کرده است که تحول بزرگی به حساب میآید. سازنده ChatGPT اعلام کرده است که Sora 2 قادر است وظایفی را انجام دهد که برای مدلهای قبلی بسیار دشوار یا حتی غیرممکن بود.
مدلهای قبلی به شکلی سادهانگارانه عمل میکردند و برای اجرای دستورات متنی، واقعیت را تغییر میدادند. مثلاً اگر یک بازیکن بسکتبال نمیتوانست توپ را داخل حلقه بیندازد، توپ ممکن بود به طور غیرواقعی داخل حلقه «تلهپورت» شود. اما در Sora 2، اگر شوت خطا برود، توپ به تخته پشت حلقه برخورد میکند و رفتار طبیعیتری دارد.
OpenAI اعلام کرده است که هرچند Sora 2 هنوز نقصهایی دارد، اما به طور قابلتوجهی بهتر از قبل از قوانین فیزیک پیروی میکند. این پیشرفت گامی مهم در مسیر ساخت شبیهسازهای واقعگرایانه است، چرا که برای رسیدن به موفقیت باید هم از پیروزیها و هم از شکستها درس گرفت.
مدل هوش مصنوعی ویدیوساز Sora 2 جهش بزرگی در کنترلپذیری داشته است. این مدل قادر است به دستورالعملهای دقیق برای چندین شات پایبند باشد و در عین حال ثبات جهان تصویری را حفظ کند. نسخه جدید OpenAI در زمینه واقعگرایی و خلق تصاویر سینمایی و انیمهای عملکردی چشمگیر دارد.
Sora 2 بهعنوان یک سیستم جامع تولید ویدیو و صدا، قادر است اصوات پسزمینه پیچیده، گفتار طبیعی و جلوههای صوتی واقعگرایانه را با کیفیت بالا ایجاد کند.
همچنین میتوان عناصر دنیای واقعی را مستقیماً در Sora 2 وارد کرد. برای مثال، OpenAI اعلام کرده است که این مدل پس از مشاهده ویدیویی از یکی از اعضای تیم، توانسته آن فرد را در هر محیطی که خلق میکند، با جلوههای بصری و صوتی دقیق بازسازی کند.
OpenAI همزمان با معرفی Sora 2، اپلیکیشن جدیدی به نام Sora عرضه کرده است که امکان ساخت، ترکیب و اشتراکگذاری ویدیوها را فراهم میکند. کاربران میتوانند تصاویر خود یا دوستانشان را به ویدیوها اضافه کنند و ویدیوهای سایر کاربران را نیز مشاهده کنند.
اپلیکیشن Sora برای iOS هماکنون در دسترس است، اما کاربران باید در فهرست انتظار ثبتنام کنند. این برنامه فعلاً فقط برای کاربران ایالات متحده و کانادا عرضه شده است. مدل Sora 2 به زودی بهصورت رایگان با برخی محدودیتها در دسترس همه قرار خواهد گرفت و کاربران ChatGPT Pro نیز به نسخه آزمایشی با کیفیت بالاتر Sora 2 Pro در سایت Sora.com دسترسی خواهند داشت.
منبع: دیجیاتو