چین از اولین مدل هوش مصنوعی تبدیل متن به ویدیو رونمایی کرد

0 مطالعه 1 دقیقه

چین از اولین مدل بزرگ هوش مصنوعی تبدیل متن به ویدیئو به نام «ویدو» در سطحِ مدل آمریکایی «سورا» در انجمن «ژونگ‌گوآن‌کون» ۲۰۲۴ پکن رونمایی کرد که رقابت هوش مصنوعی در عرصه جهانی را تشدید می‌کند.

این مدل قادر است با دریافت یک متن، تنها با یک کلیک خروجی ویدیویی با کیفیت بالا به مدت 16 ثانیه و با رزولوشن 1080p تولید نماید.

این دستاورد حاصل همکاری مشترک دانشگاه Tsinghua و شرکت فناوری هوش مصنوعی چینی ShengShu Technology بوده و ویدو را به عنوان اولین مدل بزرگ هوش مصنوعی تبدیل متن به ویدیئو در چین با قابلیت‌های منحصر به فرد از جمله “مدت زمان خروجی طولانی‌تر، انسجام استثنایی و پویایی بالا” معرفی می‌کند.

به گفته دکتر ژو جون، معاون مدیر موسسه هوش مصنوعی Tsinghua، ویدو به عنوان یک مدل هوش مصنوعی بومی چین، قادر به درک و تولید محتوای مرتبط با فرهنگ چین مانند پاندا و اژدهای چینی (لونگ) است.

ویدو در مقایسه با «سورا» یک مدل هوش مصنوعی تولیدکننده که توسط OpenAI ایالات متحده در اوایل سال جاری توسعه یافته است. قادر به درک و تولید عناصر چینی مانند پاندا و اژدها است.

این شرکت همچنین اضافه کرد که هسته اصلی این مدل بزرگ در سپتامبر ۲۰۲۲ راه‌اندازی شده است که زودتر از پذیرش معماری «سورا» بوده است.

Tsinghua همچنین دانشکده هوش مصنوعی را تأسیس کرده است که بر روی تئوری‌های بنیادی، ساختارها و پرورش استعدادهای میان‌رشته‌ای در حوزه هوش مصنوعی تمرکز خواهد کرد. هدف از این دانشکده، تربیت نخبگان هوش مصنوعی چین و دستیابی به نوآوری‌های پیشگامانه از طریق روش‌های آموزشی نوین است.

این دانشکده با اتکا به مزایای دانشگاهی و پتانسیل‌های صنعتی پکن، به دنبال همکاری‌های بین‌المللی و تبدیل شدن به قطب جهانی هوش مصنوعی است.