سئووبتیمایزر – به نظر می‌رسد چین در توسعه مدل هوش مصنوعی خود به سرعت در حال پیشرفت است و Kling شاهدی بر این رشد سریع است.

در فوریه امسال، شرکت اوپن ای‌آی، Sora مدل تولید ویدیوی خود را راه‌اندازی کرد که می‌تواند ویدیوهای یک دقیقه‌ای با کیفیت بالا ایجاد کند.

Sora هنوز برای عموم در دسترس نیست، اما به نظر می‌رسد یک مدل دیگر تبدیل متن به ویدیو در تیتر خبرها باشد.

شرکت چینی Kuaishou Technology که به پلتفرم معروف ویدیوی کوتاه است، از مدل تبدیل متن به ویدئو به نام Kling رونمایی کرده است.

برخلاف Sora، به نظر می‌رسد Kling در طریق لیست انتظار در دسترس کاربران قرار گرفته است.

فیلم‌های با کیفیت بالا تولید کنید

Kling از فناوری مشابه Sora استفاده می‌کند و می‌تواند ویدیوهای HD 1080p تولید کند که تا دو دقیقه طول بکشد.

بخوانید  جدیدترین قیمت رمزارزها در جهان: ۲۳ خرداد

این مدل می‌تواند حرکات واقع گرایانه در مقیاس بزرگ ایجاد کند که اساساً ویژگی‌های جهان فیزیکی را تقلید می‌کند. گفته می‌شود که Kling بر اساس معماری Diffusion Transformer ساخته شده است و می‌تواند پیام‌های متنی را به تصاویر و ویدیوهای زنده تبدیل کند.

مدل Kling از بازسازی 3 بعدی پیشرفته صورت و بدن با استفاده از فناوری 3D VAE این شرکت استفاده می‌کند و به کاربران امکان می‌دهد ویدیوهایی با نسبت‌های مختلف بسازند.

تبدیل متن به ویدئو

این شرکت یک ویدئوی نمایشی منتشر کرد که توانایی کلینگ را برای ایجاد یک ویدیو تا دو دقیقه با سرعت 30 فریم بر ثانیه نشان می‌داد.

بخوانید  با این تراشه ارزان، پهپادها را خودران کنید

اما سورا فقط قادر به ایجاد ویدیوهای یک دقیقه‌ای است. بر اساس نمونه‌های ارسال شده در ایکس (توییتر سابق)، به نظر می رسد ویدیوهای ایجاد شده توسط Kling به طور دقیق ویژگی‌های فیزیکی دنیای واقعی را تقلید می‌کنند.

لازم به ذکر است که Kling تنها مدل متن به ویدئو از چین نیست.

در ماه آوریل، Vidu AI را منتشر کرد که یک مدل متن به ویدیو که قادر به تولید ویدیوهای 16 ثانیه‌ای با کیفیت 1080p است.

Sora
تاخیر داشت

OpenAI در میدان رقابت با بازیکنان موجود مانند Runway و Pika Labs روبرو است که هر دو در حال تقویت بازی در هوش مصنوعی هستند.

همچنین رقبای جدیدی مانند Haiper، LTX Studio و Higgsfield وجود دارند که هر کدام رویکردهای متفاوتی را برای ویدیوهای هوش مصنوعی اتخاذ می‌کنند و حتی گوگل نیز یک مدل Veo جدید دارد.

بخوانید  افزایش نشانه‌های زوال عقل در بایدن

 لازم به ذکر است که پس از رونمایی OpenAI از Sora در فوریه گذشته، شاهد استفاده از تعداد فزاینده‌ای از سازندگان از آن بودیم، از جمله 5 کارگردان برنده جایزه که قرار است هفته آینده فیلم‌های کوتاه ساخته شده توسط Sora را به نمایش بگذارند.

با وجود این، هنوز به طور گسترده در دسترس عموم نیست. حقیقت این است که تاخیر OpenAI فنی نیست بلکه به دلیل ایمنی است.

این شرکت می‌گوید که می‌خواهد اطمینان حاصل کند که این مدل از هوش مصنوعی نمی‌تواند برای به دست آوردن اطلاعات گمراه‌کننده یا اهداف مخرب قبل از ارسال آن به عموم مردم استفاده شود.