أوردت صحيفة “نيويورك تايمز” الأمريكية، أن شركة “أوبن ايه أي” دربت نموذجها للذكاء الاصطناعي GPT-4 على محتوى منصة “يوتيوب”.
وأفادت الصحيفة بأن “أوبن ايه أي” اعتمدت على نموذج النسخ الصوتي Whisper لتحويل الصوت في مقاطع الفيديو إلى نصوص، قبل استخدامها في تدريب GPT-4، الذي يُعتبر أحد أبرز نماذجها حاليًا.
وأشارت الصحيفة إلى أن هذه الآلية تثير تساؤلات قانونية، وتقع في منطقة رمادية بخصوص قوانين حقوق الطبع والنشر للذكاء الاصطناعي، إلا أن “أوبن ايه أي” تعتبرها “استخدامًا عادلاً”.
وأكدت المصادر أن جريج بروكمان، رئيس “أوبن ايه آي”، شارك شخصيًا في جمع مقاطع الفيديو المستخدمة في التدريب.
ومن جانبها، صرحت المتحدثة باسم “أوبن ايه آي”، ليندساي هيلد، لموقع The Verge التقني، بأن الشركة تعتمد على “مصادر متعددة منها البيانات العامة والشراكات للبيانات غير العامة”.
تأتي هذه الخطوة بعد أن دربت “أوبن ايه آي” نماذجها على مصادر بيانات متنوعة، وبحثت في تحويل مقاطع الفيديو والبودكاست والكتب الصوتية في يوتيوب إلى نصوص كأحد أفضل الموارد للتدريب.
وفي الوقت نفسه، أفادت الصحيفة بأن هناك أشخاصًا في جوجل كانوا على علم بنشاط “أوبن ايه آي”، ولكنهم لم يتخذوا إجراءات؛ حيث كانت جوجل نفسها تستخدم مقاطع الفيديو في يوتيوب لتدريب نماذجها الخاصة.
وفي تصريح حديث، حذر الرئيس التنفيذي ليوتيوب شركة “أوبن ايه آي” من تدريب نموذجها الجديد على تحويل النصوص إلى فيديوهات لمقاطع الفيديو المنشورة على المنصة.