هوش مصنوعی Sora در دسترس عموم قرار می‌گیرد: تبدیل متن به ویدیو!

0 مطالعه 2 دقیقه

رئیس ارشد بخش فناوری (CTO) شرکت OpenAI، میرا مراتي، به وال استریت ژورنال اعلام کرد که Sora در نهایت صدا را نیز به خروجی‌های خود اضافه خواهد کرد.

به زودی می توانید تبدیل کننده متن به ویدیوی جذاب OpenAI را خودتان امتحان کنید. میرا مراتي، مدیر ارشد فناوری OpenAI، در مصاحبه ای با وال استریت ژورنال اعلام کرد که هوض مصنوعی Sora در سال جاری و احتمالاً طی چند ماه آینده در دسترس عموم قرار خواهد گرفت.

شرکت OpenAI برای اولین بار در ماه فوریه از Sora رونمایی کرد که قادر است بر اساس یک متن ورودی، صحنه های بسیار واقعی و با جزئیات بالا تولید کند. این شرکت در ابتدا این ابزار را فقط برای هنرمندان طراح، طراحان و فیلمسازان در دسترس قرار داد، اما این امر مانع انتشار برخی از ویدیوهای ساخته شده توسط Sora در پلتفرم های اشتراک ویدیو نشد.

علاوه بر در دسترس قرار دادن این ابزار برای عموم، مراتي اعلام کرد که OpenAI قصد دارد در نهایت قابلیت تولید صدا را به Sora اضافه کند، که این امکان صحنه ها را حتی واقعی‌تر می‌کند. این شرکت همچنین می خواهد به کاربران امکان ویرایش محتوای ویدیوهای تولید شده توسط Sora را بدهد، زیرا ابزارهای هوش مصنوعی همیشه تصاویر دقیقی ایجاد نمی کنند.

مراتي در پاسخ به سوالی در مورد داده‌هایی که برای آموزش Sora استفاده شده است، جزئیات دقیقی ارائه نداد و به نظر می رسد از پاسخ مستقیم طفره رفته است.

او گفت: “من به جزئیات داده های مورد استفاده نمی پردازم، اما این داده ها به صورت عمومی در دسترس بودند یا دارای مجوز بودند.”

مراتي همچنین گفت که مطمئن نیست این ابزار از ویدیوهای یوتیوب، فیسبوک و اینستاگرام استفاده کرده باشد. او تنها به وال استریت ژورنال تایید کرد که Sora از محتوای وبسایت Shutterstock استفاده می کند که OpenAI با آن مشارکت دارد.

مراتي همچنین به وال استریت ژورنال گفت که اجرای Sora هزینه بسیار بیشتری دارد. OpenAI در تلاش است تا این ابزار را با هزینه ای مشابه با DALL-E، مدل متن به تصویر هوش مصنوعی این شرکت، زمانی که برای عموم منتشر شد، در دسترس قرار دهد. نمونه‌های بیشتری از انواع ویدیوهایی که این ابزار می‌تواند تولید کند را می‌توانید در گزارش وال استریت ژورنال مشاهده کنید، از جمله گاو انیمیشنی در یک مغازه چینی و یک بررسی گوشی هوشمند توسط یک پری دریایی.

نگرانی ها در مورد ابزارهای هوش مصنوعی تولیدکننده محتوا و پتانسیل آنها برای ایجاد اطلاعات غلط افزایش یافته است.

مراتي می گوید که به احتمال زیاد Sora پس از انتشار، مشابه سیاست های DALL-E، قادر به تولید تصاویر چهره های سرشناس نخواهد بود. همچنین برای متمایز کردن ویدیوها از واقعیت، یک واترمارک بر روی آن‌ها قرار خواهد گرفت، اما همانطور که همکارم امیلیا دیوید اشاره می کند، واترمارک ها راه حل کاملی نیستند.