كشفت Google DeepMind عن نيتها الاستعانة بنماذج الذكاء الاصطناعي لتحويل المقاطع النصية إلى فيديو من خلال منصة Veo2، وهي الأحدث في مجال تحويل النص إلى فيديو.
تتميز هذه المنصة بقدرتها على إنشاء مقاطع فيديو واقعية بدقة 4K استنادًا إلى مطالبات نصية بسيطة.
وعلى الرغم من أن Veo2 ليست الوحيدة في هذا المجال، إلا أن شركة Sora التابعة لـ OpenAI تعتبر منافسًا رئيسيًا، حيث تقترب من تقديم تجربة جديدة في إنشاء مقاطع الفيديو المولدة بواسطة الذكاء الاصطناعي.
تم إطلاق Sora في أوائل ديسمبر من هذا العام وهي متاحة لمستخدمي ChatGPT Plus على مستوى العالم. بينما لا يزال Veo2 من جوجل في مرحلة الاختبار التجريبي.
تتمتع Veo2 بميزة واضحة على Sora في عدة جوانب، أهمها دقة الفيديو، إذ توفر دقة تصل إلى 4K، مما يعكس جودة أفضل لمقاطع الفيديو.
في المقابل، تقدم Sora دقة قصوى تبلغ 1080 بكسل، وهي دقة مقبولة لكنها أقل من 4K.
بالإضافة إلى ذلك، تتيح Veo2 عرض مقاطع فيديو تصل مدتها إلى دقيقتين، بينما تقتصر مدة الفيديوهات في Sora على 20 ثانية فقط.
ومن المزايا الأخرى التي تقدمها Veo2 هي التحكم السينمائي، حيث تمنح المستخدمين خيارات للتحكم في الكاميرا وإضافة حركات سينمائية مثل التحريك والإمالة.
من جهة أخرى، يتيح Sora استخدامه للأغراض التجارية من خلال اشتراك ChatGPT Plus، مما يوفر للمستخدمين فرصًا إضافية للاستفادة من هذه التكنولوجيا الجديدة.