علي بابا تطلق أداة Tora لتوليد مقاطع الفيديو بالذكاء الاصطناعي

mainThumb
علي بابا

08-08-2024 05:25 PM

السوسنة-  تعمل مجموعة "علي بابا" الصينية على تطوير أداة جديدة لتوليد الفيديو تسمى Tora، تعتمد على نموذج Sora مفتوح المصدر المطور بواسطة شركة OpenAI. وذكر باحثو "علي بابا" أنهم استخدموا نموذج OpenSora لتطوير "تورا"، وهو إطار عمل لإنشاء الفيديوهات باستخدام أوامر نصية. تم نشر تفاصيل المشروع في ورقة بحثية الأسبوع الماضي من قبل فريق مكون من خمسة باحثين في "علي بابا".

يعتمد تطوير أداة Tora على معمارية تسمى Diffusion Transformer (DiT)، وهي بنية جديدة تشغل نموذج Sora. هذا النموذج يتيح إنشاء فيديوهات باستخدام مسارات توجيه لحركة العناصر داخل المقاطع، مع مراعاة العوامل المؤثرة في حركة العناصر في العالم الحقيقي. وأوضح الباحثون أن المشروع لا يزال مستمراً ولم يتم تحديد موعد لإطلاق الأداة للاستخدام العام.

تأتي هذه الخطوة من "علي بابا" كجزء من جهودها لإطلاق أدوات صينية منافسة في مجال توليد الفيديو، مشابهة لنموذج Sora الخاص بـ OpenAI. في فبراير الماضي، أطلقت الشركة نموذج توليد الفيديو الذكي Emote Portrait Alive (EMO)، الذي يمكنه تحويل ملف صوتي وصورة لوجه شخص إلى فيديو يظهر فيه الشخص يتحدث أو يغني بصوته الأصلي بدقة عالية. يتميز نموذج EMO بالقدرة على محاكاة حركات الوجه بشكل واقعي أثناء النطق والغناء، دون الحاجة لاستخدام نماذج ثلاثية الأبعاد، مما يزيد من كفاءة العملية ويعطي نتائج دقيقة. تم تدريب النموذج على 250 ساعة من الفيديوهات، مما ساعده في تحسين التعرف على التغيرات الدقيقة في وجوه البشر.



اقرأ المزيد عن:









تعليقات القراء

لا يوجد تعليقات


أكتب تعليقا

لا يمكن اضافة تعليق جديد