ابتكرت مؤسسة "Arc Prize"، وهي منظمة غير ربحية شارك في تأسيسها الباحث البارز في مجال الذكاء الاصطناعي فرانسوا شوليت اختبارًا جديدًا لقياس الذكاء العام لنماذج الذكاء الاصطناعي الرائدة، وتمكن الاختبار الجديد، المسمى "ARC-AGI-2" من التفوق على معظم نماذج الذكاء الاصطناعي حتى الآن.


الاختبار يختبر قدرة نماذج الذكاء الاصطناعي على التكيف مع مشكلات لم تواجهها من قبل. فيُجبرها على التفكير المجرد والتعلم الفوري، بدلاً من الاعتماد على الحفظ أو الحسابات المكثفة.
فلم تتجاوز النماذج المتقدمة في "الاستدلال"، مثل o1-pro من OpenAI و R1 من DeepSeek، نسبة 1.3% في الأداء، وحصلت النماذج القوية غير المعتمدة على الاستدلال، مثل GPT-4.5 و Claude 3.7 Sonnet و Gemini 2.0 Flash، على نسبة 1% فقط.