في خطوة تشير إلى مستقبل خيال علمي غريب من الترفيه التفاعلي، تدرب Genie من Google DeepMind على تحويل الصور إلى ألعاب فيديو قابلة للعب، وهذا ليس سوى أحدث تقنية في قائمة متنامية بسرعة من التقنيات تعتمد على الذكاء الاصطناعي، وفق ما يشير إليه موقع “New Atlas”.
يعتمد هذا النموذج الصغير نسبيًا، الذي يبلغ 11 مليار وحدة معالجة وفهم نصوص، على تدريبه على أكثر من 200,000 ساعة من الفيديو لأشخاص يلعبون ألعابًا على غرار المنصات ثنائية الأبعاد، دون إشراف بشري.
I am really excited to reveal what @GoogleDeepMind‘s Open Endedness Team has been up to 🚀. We introduce Genie 🧞, a foundation world model trained exclusively from Internet videos that can generate an endless variety of action-controllable 2D worlds given image prompts. pic.twitter.com/TnQ8uv81wc
— Tim Rocktäschel (@_rockt) February 26, 2024
ورغم أن تدفقات الفيديو -التي يتدرب عليها- لا تحتوي على معلومات محددة حول وقت الضغط على زر أو عنصر التحكم، إلا أن النموذج الجديد أظهر قدرة اكتشاف الميكانيكا والفيزياء المعنية بالحركة.
ونتيجة لذلك، يمكن لهذا النموذج قبول صورة واحدة – سواء كانت حقيقية أو رسمًا تخطيطيًا أو حتى صورة تم إنشاؤها بالذكاء الاصطناعي – وتحويلها إلى لعبة قابلة للعب، تستجيب لعناصر التحكم التي يستخدمها المستخدم. وعلى الرغم من أن Genie هو مشروع بحثي وليس منتجًا نهائيًا، إلا أن كل المؤشرات تشير إلى أنه من الممكن تحسينه بشكل كبير مع الوقت وزيادة التدريب والحوسبة.
ويقول “New Atlas” إن الثورة التي يمثلها Genie تتجاوز الألعاب إلى مجالات أخرى من الترفيه، مع تطور التقنيات التفاعلية ثلاثية الأبعاد واستخدام الذكاء الاصطناعي في إنشاء شخصيات ونماذج لغوية طبيعية. ومع تقدم أجهزة الواقع الافتراضي بوتيرة سريعة، فإن النتائج المذهلة ستستمر في التحسن بشكل ملحوظ، وهذا يشير إلى تغيير جذري في مفهوم الترفيه بشكل عام.
في بعض أمثلة التدريب، لم يتم الاهتمام بالحفاظ على أصوات ممثلي الشخصيات الأصلية، ولكن هذا الأمر بات تافهًا من وجهة نظر التقنية، بالنظر إلى تطبيقات يمكن تنزيلها الآن تتيح للمستخدمين استنساخ أصواتهم أو أصوات أي شخص آخر.
ونظرًا للمئات من الساعات المستهلكة في تسجيلات الصوت عالية الجودة التي تدخل في إنتاج ألعاب الفيديو، فإن هناك فرصًا هائلة لاستديوهات الألعاب لتدريب نماذج الصوت. ومن المتوقع أن نرى طوفانًا من عمليات إعادة الإصدار المحسنة بواسطة الذكاء الاصطناعي لألعاب قديمة، حيث يمكن للاعبين أن يجروا محادثات طبيعية غير محدودة مع الشخصيات غير القابلة للعب.
وبشكل عام، يمكن القول إن التقنيات الحديثة تتيح لنا إنشاء تجارب تفاعلية غير مسبوقة في عالم الترفيه، وهذا ما يشير إلى مستقبل واعد ومليء بالإبداع والابتكار في صناعة الألعاب والترفيه بشكل عام. حيث سيكون بإمكانك البدء بأي شيء، سواء بدون شيء أو ببضعة رسومات، وسينشئ الذكاء الاصطناعي عالمًا تفاعليًا جميلًا بشكل غير عادي.
ووفق هذا المستقبل المتوقع بناء على النماذج الجديدة تلك، ستكون قادرًا على تصميم تجربة شفهية، ثم اللعب والتفاعل معها، وتعديل الأشياء مثل المخرج بدلًا من المبرمج.
وبفضل الموارد الحوسبية الكافية، ستتمكن من إنشاء ألعاب كاملة بهذه الطريقة، بتعبيرات فردية أو لاعبين متعددين يمكنهم المشاركة مصنوعين جميعًا من خيالك.