أعلنت شركة OpenAI عن إطلاق سلسلة نماذج GPT-4.1 الجديدة، التي تضم ثلاثة إصدارات: الإصدار الأساسي، ونسختي Mini وNano، وجميعها موجّهة لتحسين الأداء في مجالات الترميز وتنفيذ التعليمات البرمجية بدقة أعلى.
وتتوفر النماذج الجديدة عبر واجهة برمجة التطبيقات (API)، دون طرحها على منصة ChatGPT حتى الآن. وتتميز بقدرتها على معالجة سياقات طويلة تصل إلى مليون رمز، أي ما يعادل نحو 750 ألف كلمة، متجاوزة بذلك حجم رواية “الحرب والسلام” الشهيرة.
يأتي هذا التطور وسط تصاعد المنافسة بين كبرى شركات الذكاء الاصطناعي، إذ أطلقت جوجل نموذج Gemini 2.5 Pro، وطرحت أنثروبيك نموذج Claude 3.7 Sonnet، فيما كشفت شركة DeepSeek الصينية عن نموذج V3 المطوّر.
وتهدف OpenAI إلى تطوير “وكيل ذكاء اصطناعي لهندسة البرمجيات” قادر على إنجاز دورة تطوير برمجيات متكاملة، بدءًا من البرمجة، مرورًا بالاختبار وضمان الجودة، وانتهاءً بإعداد التوثيق الفني.
وأكدت الشركة أن نموذج GPT-4.1 يمثّل خطوة نحو هذا الهدف، وقد تم تحسينه استنادًا إلى ملاحظات المطورين، مثل دعم واجهات الاستخدام، وتقييد التعديلات غير الضرورية، وتحسين التنسيق البرمجي للأدوات والردود.
ووفق OpenAI، يتفوق GPT-4.1 الكامل على إصداري GPT-4o وGPT-4o Mini في اختبارات SWE-bench، بينما تمتاز النسخ الأخف Mini وNano بالسرعة وكفاءة الأداء، وإن كانت أقل دقة. ويُعد Nano الأسرع والأقل تكلفة في تاريخ الشركة.
وفي اختبارات SWE-bench Verified، تراوح أداء GPT-4.1 بين 52% و54.6%، بينما حقق نموذج جوجل 63.8%، ونموذج Claude 3.7 Sonnet سجل 62.3%، ما يبرز تفوّق المنافسين في هذا المعيار تحديدًا.
كما سجّل GPT-4.1 دقة بلغت 72% في اختبار Video-MME لفهم مقاطع الفيديو الطويلة غير المترجمة، حسب ما أعلنت الشركة.
ورغم الأداء القوي، أقرت OpenAI بوجود تحديات متبقية، خصوصًا في المهام البرمجية المعقدة، مثل قضايا الأمان وتصحيح الأخطاء، مع تراجع الأداء عند إدخال عدد كبير من الرموز.
وتجدر الإشارة إلى أن GPT-4.1 يعتمد على قاعدة معرفية محدّثة حتى يونيو 2024، ما يمنحه ميزة التعامل مع أحدث المعلومات مقارنة بالإصدارات السابقة.