انتهت بطولة LLM للشطرنج: OpenAI o3 تتوج باللقب، و xAI Grok 4 لم تفز بأي جولة وتم إغلاقها بالكامل.

انتهت مسابقة الشطرنج الدولية Kaggle AI، حيث تمكن o3 غير المدرب خصيصًا من هزيمة Grok 4 بنتيجة 4-0، مما يظهر قدرته الكبيرة على الاستنتاج. (مقدمة: هدد ماسك بمقاضاة أبل: هناك سلوك احتكاري في تصنيفات App Store، وضغوطات خبيثة على Grok) (معلومات إضافية: Grok 4 أصبح متاحًا للاستخدام المجاني اليوم، ومواجهة مباشرة بين ماسك xAI و GPT-5) أعلنت Google من خلال Kaggle عن نتائج "عرض الذكاء الاصطناعي في الشطرنج" في 14 أغسطس، حيث حقق نموذج اللغة الكبير الشامل OpenAI o3 فوزًا ساحقًا 4-0 على Grok 4 من xAI ليحقق البطولة، ويصبح أول نموذج LLM يُنهي خصمه دون تدريب متخصص. شارك في البطولة 8 مجموعات من الذكاء الاصطناعي، واستمرت لمدة ثلاثة أيام، بنظام الإقصاء. أبرز ما في مسابقة نماذج اللغة وفقًا لتقرير OpenTools.ai، قدم o3 نتائج مدهشة بفوز متتابع 4-0 في ثلاث مباريات، كما أقصى في نصف النهائي النسخة الخفيفة من نفسه o4 mini. بالمقابل، كانت Grok 4 غالبًا ما تتقدم في بداية المباراة، لكنها فقدت عدة مرات في نهاية المباراة (م sacrificing لأقوى قطعة، الملكة). علق أستاذ الشطرنج Hikaru Nakamura على o3 بأنه "يخطئ قليلاً جدًا"، وأشار إلى أن Grok 4 كانت تظهر غالبًا تفجيرات تكتيكية. وصف بطل العالم السابق Magnus Carlsen أسلوب لعب Grok بأنه: كأنك تشاهد طفلًا يلعب الشطرنج. وقدر Elo الخاص بـ Grok بحوالي 800، وo3 بحوالي 1200، وهو أقل بكثير من أفضل اللاعبين البشر أو أنظمة الشطرنج المتخصصة. Elo: هو نظام تصنيف احترافي (بالإنجليزية: Elo rating system) تم إنشاؤه بواسطة الفيزيائي الأمريكي المجري Arpad Elo لقياس مستوى مختلف أنشطة اللعب، وهو المعيار المعترف به عالميًا لتقييم مستوى اللعب، ويستخدم على نطاق واسع في الشطرنج، والجودو، وكرة القدم، وكرة السلة، وغيرها من الرياضات. أعلى نتيجة في الشطرنج Elo حققها Magnus Carlsen برصيد 2882 نقطة. الذكاء الاصطناعي الشامل مقابل الذكاء الاصطناعي المتخصص تعتمد أنظمة مثل Stockfish المتخصصة على البحث العميق والتقييمات المتخصصة، وتتمتع بمعدل حوالي 3644 Elo على المدى الطويل. بينما يتعلم النموذج الشامل LLM من خلال مجموعة واسعة من البيانات عبر مجالات متعددة، فإن لعب الشطرنج هو مجرد امتداد لقدراته الاستنتاجية. على الرغم من أن o3 تمكن من هزيمة Grok 4، إلا أنه في وقت سابق من هذا العام لم يتمكن من التغلب على Stockfish، مما يُظهر أن النموذج الشامل لا يزال لديه فجوات في الاستقرار والعمق في استنتاجات الألعاب الشطرنجية. تقارير ذات صلة مراهنات OpenAI، سون زينغ يي "قد حقق انتعاشًا" مرة أخرى تم اختراق مطوري إيثريوم الذين قاموا بتثبيت "ملحق ذكاء اصطناعي خبيث"، وتم تفريغ المحفظة المشفرة خلال ثلاثة أيام، حتى مع عشر سنوات من الخبرة في أمن المعلومات. أحدث رؤى a16z: هل ماتت التجارة الإلكترونية التقليدية؟ المنصات الأصلية للذكاء الاصطناعي تعيد تعريف "التسوق". "انتهاء مسابقة الشطرنج LLM: OpenAI o3 يفوز، xAI Grok 4 لم يحقق أي فوز وتم إغلاقه"، تم نشر هذه المقالة لأول مرة في BlockTempo، "BlockTempo - أكثر وسائل الإعلام تأثيرًا في مجال البلوكتشين."

XAI-10.16%
GROK-12.08%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت