أحد صفحات التقدم العلمي للنشر
تعلم الآلةرياضة

تعلّم الآلة يتنبأ بالفائز بكأس العالم

بعد محاكاة بطولة كرة القدم بأكملها مئة ألف مرة توقع الباحثون النتيجة

بدأت مباريات كأس العالم لكرة القدم عام 2018 في روسيا يوم الخميس ومن المرجح أن تكون واحدة من الأحداث الأكثر مشاهدة في التاريخ على نطاق واسع، وأكثر شعبية حتى من الألعاب الأولمبية. لذا، يُعد الفائزون المحتملون ذوي أهمية كبيرة.

وإحدى الطرق لقياس النتائج المحتملة هي النظر إلى احتمالات المراهنات. إذ تستخدم هذه الشركات الإحصائيين المحترفين لتحليل قواعد بيانات شاسعة تحتوي على النتائج السابقة بهدف التنبؤ بالنتائج بطريقة تُحدد مقدار احتمال النتائج المختلفة لأي تطابق محتمل. وبهذه الطريقة يمكن للمشرفين على سجلات المراهنة تقديم احتمالات حول جميع المباريات التي ستُبدأ في الأسابيع القليلة المقبلة، إضافة إلى الفائزين المحتملين.

ويأتي أفضل تقدير من دمج جميع الاحتمالات في الكثير من سجلات وكلاء المراهنات المختلفين. ويقترح هذا النهج أنّ البرازيل هي المرشح الأفضل للفوز بكأس العالم 2018، مع احتمال 16.6 %، تليها ألمانيا (12.8 %) وإسبانيا (12.5 %).




ولكن في السنوات الأخيرة، طوّر الباحثون تقنيات تعلّم الآلة Machine-learning لها القدرة على التفوق على الأساليب الإحصائية التقليدية. وما الذي تتوقعه هذه التقنيات الجديدة كنتيجة محتملة لكأس العالم لعام 2018؟

وتأتي الإجابة عن ذلك من عمل أندرياس غرول Andreas Groll من جامعة دورتموند التقنية Technical University of Dortmund في ألمانيا، وعدد قليل من الزملاء. إذ دمجوا تعلم الآلة والإحصاءات التقليدية، باستعمال تقنية تسمى نهج الغابة العشوائية Random-Forest Approach، لتحديد فائز مختلف أكثر احتمالا.

إليك أولا بعض المعلومات الأساسية. ظهرت التقنية العشوائية في السنوات الأخيرة كطريقة قوية لتحليل مجموعات البيانات الكبيرة مع تجنب بعض عيوب أساليب تنقيب البيانات Datamining الأخرى. إذ تستند الطريقة إلى فكرة أنّ بعض الأحداث المستقبلية يمكن تحديدها من خلال أشجار القرار Decision Trees التي تُحسب منها النتيجة في كل فرع بالرجوع إلى مجموعة من بيانات التدريب.

ومع ذلك، فإن أشجار القرار تُعاني مشكلةً معروفة جيدا. ففي المراحل الأخيرة من عملية التفرّع يمكن أن تصبح القرارات مُحرّفة بشدة من خلال بيانات التدريب المتفرقة والعُرضَة للتفاوت الكبير في هذا النوع من الحل، وهي مشكلة تُعرف بـ “المطابقة المبالغ فيها” Overfitting.

إذ إنّ نهج الغابة العشوائية مختلف. فبدلاً من حساب النتيجة في كل فرع، تحسب العملية نتيجةَ الفروعِ العشوائية. إذ تقوم بذلك عدّة مرات، وفي كل مرة مع مجموعة مختلفة من الفروع المختارة عشوائياً. والنتيجة النهائية هي متوسط جميع أشجار القرار التي أُنشِئَت عشوائياً.

ولهذا النهج مزايا مهمة. أولاً، أنه لا يُعاني المشكلة المُجهِدة نفسها التي ابتُليت بها أشجار القرار العادية. كما يكشف عن العوامل الأكثر أهمية في تحديد النتيجة.

لذا، إذا تضمنت شجرة قرارات معينة الكثيرَ من العوامل، فإنه يصبح من السهل رؤية أي منها له التأثير الأكبر في النتيجة وأيها لا يكون مؤثرا. ويمكن تجاهل هذه العوامل الأقل أهمية في المستقبل.

وقد استخدم غرول وزملاؤه هذه النهج بالضبط لنمذجة كأس العالم 2018. إذ صمموا نتائج كل لعبة من المرجح أن تلعبها الفرق واستخدموا النتائج لبناء المسار الأكثر احتمالا في المباراة.

وقد بدأ غرول وزملاؤه بمجموعة واسعة من العوامل المحتملة التي قد تحدد النتيجة. وتشمل العوامل الاقتصادية مثل: الناتج المحلي الإجمالي GDP والسكان، وترتيب الفرق الوطنية لدى الفيفا FIFA، وكذلك خواص الفرق نفسها، مثل متوسط أعمارهم، وعدد لاعبي دوري أبطال أوروبا Champions League لديهم، وما إذا كانوا يمتازون باللعب في ملعبهم الوطني، وما إلى ذلك.

ومن المثير للاهتمام أن نهج الغابة العشوائية يسمح لغرول وزملائه بتضمين محاولات التصنيف الأخرى، مثل التصنيفات المستخدمة من قِبل وكلاء المراهنات.

ويُوفر إدخال كل هذا في النموذج Model بعض الأفكار المثيرة للاهتمام. فعلى سبيل المثال، تبيّن أنّ أكثر العوامل المؤثرة هي تصنيفات الفريق التي أُنشِئت بواسطة طرق أخرى، بما في ذلك تلك الخاصة بوكلاء المراهنات والفيفا وغيرهم.

وتشمل العوامل المهمة الأخرى إجمالي الناتج المحلي وعدد لاعبي دوري الأبطال في الفريق. وكما تشمل العوامل غير المهمة عدد سكان البلد وجنسية المُدرب وما إلى ذلك.

وتختلف التوقعات التي توصلت إليها هذه العملية عن غيرها اختلافات مهمة. وكبداية، يختار نهج الغابة العشوائية إسبانيا باعتبارها الفائز الأكثر احتمالا، مع احتمال قدره 17.8%.

ومع ذلك فالعامل الكبير المؤثر في هذا التنبؤ وهو هيكل البطولة نفسها. إذا تمكنت ألمانيا من تخطي مرحلة المجموعات من المنافسة، فمن المرجح أن تواجه منافسة قوية في مرحلة خروج المغلوب المكونة من 16 فريقا. وبسبب هذا يحسب نهج الأغلبية العشوائية فرص ألمانيا في الوصول إلى الدور ربع النهائي بنسبة 58%. وعلى النقيض من ذلك، فمن غير المحتمل أن تواجه إسبانيا منافسة قوية في الدور نصف النهائي، ومن ثم فإنّ لديها فرصة 73% للوصول إلى الدور ربع النهائي.

وإذا وصل كلاهما إلى الربع النهائي، فإنّ فرصتهما متساوية في الفوز. ويقول غرول وزملاؤه: “إنّ إسبانيا مُفضّلة قليلاً على ألمانيا، ويرجع ذلك أساساً إلى حقيقة أنّ ألمانيا لديها فرصة كبيرة نسبياً للخروج من دور السادس عشر.”

ولكن هناك تطورا إضافيا. إذ تُتيح عملية الشجرة العشوائية محاكاة الدورة بأكملها، مما ينتج من ذلك نتيجة مختلفة.

وقد قام غرول وزملاؤه بمحاكاة كامل البطولة مئة ألف مرة. وكما يقولون: “وفقا لمسار المباراة الأكثر احتمالا، سيفوز الفريق الألماني بكأس العالم بدلا من الإسبان.”

وبطبيعة الحال، وبسبب هذا العدد الضخم من التبديلات في المباريات، فإنّ هذا المسار لا يزال بعيد الاحتمال. ووضع غرول وزملاؤه الاحتمالات بنحو 1 في 100 ألف.

وهكذا، ها نحن ذا. ففي بداية الدورة تمتلك إسبانيا أفضل فُرص الفوز، بحسب غرول وزملائه. ولكن إذا نجحت ألمانيا في الوصول إلى الدور ربع النهائي، فإنها ستصبح في المرتبة الأولى.

وستقام مباريات البطولة يوم الخميس، عندما تُباري روسيا، البلد المضيف، المملكة العربية السعودية. وللأسف، لا يبدو أنّ أيًّا من هذه الفِرق سيتأهّل حتى إلى الدور ربع النهائي.

المصدر
MIT Technology Review
اظهر المزيد

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

For security, use of Google's reCAPTCHA service is required which is subject to the Google Privacy Policy and Terms of Use.

زر الذهاب إلى الأعلى