چین از اولین مدل هوش مصنوعی تبدیل متن به ویدیو رونمایی کرد
چین از اولین مدل بزرگ هوش مصنوعی تبدیل متن به ویدیئو به نام «ویدو» در سطحِ مدل آمریکایی «سورا» در انجمن «ژونگگوآنکون» ۲۰۲۴ پکن رونمایی کرد که رقابت هوش مصنوعی در عرصه جهانی را تشدید میکند.
این مدل قادر است با دریافت یک متن، تنها با یک کلیک خروجی ویدیویی با کیفیت بالا به مدت 16 ثانیه و با رزولوشن 1080p تولید نماید.
این دستاورد حاصل همکاری مشترک دانشگاه Tsinghua و شرکت فناوری هوش مصنوعی چینی ShengShu Technology بوده و ویدو را به عنوان اولین مدل بزرگ هوش مصنوعی تبدیل متن به ویدیئو در چین با قابلیتهای منحصر به فرد از جمله “مدت زمان خروجی طولانیتر، انسجام استثنایی و پویایی بالا” معرفی میکند.
به گفته دکتر ژو جون، معاون مدیر موسسه هوش مصنوعی Tsinghua، ویدو به عنوان یک مدل هوش مصنوعی بومی چین، قادر به درک و تولید محتوای مرتبط با فرهنگ چین مانند پاندا و اژدهای چینی (لونگ) است.
ویدو در مقایسه با «سورا» یک مدل هوش مصنوعی تولیدکننده که توسط OpenAI ایالات متحده در اوایل سال جاری توسعه یافته است. قادر به درک و تولید عناصر چینی مانند پاندا و اژدها است.
این شرکت همچنین اضافه کرد که هسته اصلی این مدل بزرگ در سپتامبر ۲۰۲۲ راهاندازی شده است که زودتر از پذیرش معماری «سورا» بوده است.
Tsinghua همچنین دانشکده هوش مصنوعی را تأسیس کرده است که بر روی تئوریهای بنیادی، ساختارها و پرورش استعدادهای میانرشتهای در حوزه هوش مصنوعی تمرکز خواهد کرد. هدف از این دانشکده، تربیت نخبگان هوش مصنوعی چین و دستیابی به نوآوریهای پیشگامانه از طریق روشهای آموزشی نوین است.
این دانشکده با اتکا به مزایای دانشگاهی و پتانسیلهای صنعتی پکن، به دنبال همکاریهای بینالمللی و تبدیل شدن به قطب جهانی هوش مصنوعی است.