لماذا تستثمر الشركات الملايين في سبيل فوز الذكاء الاصطناعي في ألعاب الفيديو؟
حقوق الصورة: شاترستوك Shutterstock
حقّق الباحثون في مجال الذكاء الاصطناعيّ مؤخرًا
تقدّمًا كبيرًا تمثّل بالفوز في إحدى ألعاب الفيديو، وذلك ضمن مشروع الذكاء
الاصطناعيّ OpenAI الذي أسّسه إيلون ماسك Elon Musk. على عكس انتصارات الذكاء الاصطناعيّ الأخيرة على لاعبين بشريين محترفين في ألعابٍ مثل البوكر وغو Go، حدث هذا التقدّم من خلال لعبةٍ لم يسمع بها الكثيرون، وهي لعبة دوتا 2 (Dota 2)
(لعبةٌ حربيّةٌ متعدّدة اللاعبين تُلعب عبر الإنترنت). ولكن بالنسبة
لمعجبي هذا النوع من الألعاب والذين تُقدّر أعدادهم بمئات الملايين فإن
وجود حاسوبٍ بإمكانه التغلّب على لاعبٍ محترفٍ يُعدّ حدثًا جللًا.
يُعدّ هذا الأمر مهمَّا أيضًا بالنسبة للباحثين في مجال الذكاء الاصطناعيّ، ولا سيما في شركاتٍ مثل غوغل Google وفيسبوك Facebook ومايكروسوفت Microsoft وآي بي إم IBM، حيث
تستثمر تلك الشركات ملايين الدولارات لصنع لاعبي ذكاء اصطناعيّ متقدّمين
قادرين على لعب الألعاب الرقميّة. مع ازيداد أهمّية الذكاء الاصطناعيّ في
مجتمعاتنا يتّسع نطاق تأثيراته الممكنة على الجميع لما يوضحه من قدرة
الحاسوب على "التفكير" بطريقةٍ استراتيجيةٍ.
الأمر المثير للاهتمام بشأن انتصار الذكاء الاصطناعيّ في لعبة دوتا 2 ،علمًا أنه تحقّق على يد بوت bot صنعته شركة البحث غير الربحيّة OpenAI والتي
تبلغ قيمتها مليار دولار، هو أنّ المطوّرين لم يبرمجوا به فهمًا عميقًا
لاستراتيجيات اللعب، بل استخدموا أسلوب التعليم العميق المعزّز deep reinforcement learning، حيث يمتلك الحاسوب معرفةً بدائيّةً فقط باستراتيجيات اللعب.
تعلّم الذكاء الاصطناعيّ كيفيّة التمييز بين قرارات
الحركات الصحيحة التي تؤدي إلى الفوز وقرارات الحركات السيّئة من خلال
اللعب ضدّ نفسه ملايين المرّات. تُخزّن هذه المعرفة ضمن مصفوفة بياناتٍ
ضخمةٍ تحتوي ملايين الأرقام تُحدّث بعد كلّ مرّةٍ يلعب بها البوت مع نفسه.
تشكّل هذه الأرقام ترميز ما يُعرف بـ "التابع"، وهو عبارةُ عن التعليمات
التي تحدّد الاستراتيجيّة التي تعلّمها الذكاء الاصطناعيّ والخاصّة بكلّ
موقفٍ من مواقف اللعبة. أي بعد أن قام الباحثون ببرمجة أسلوب التعلّم
تمكّنت الآلة من تعليم نفسها بطريقةٍ فعّالةٍ كيفيّة اتّخاذ قراراتٍ جيّدة
أثناء اللعب.
تمثّل لعبة دوتا 2 جزءًا من حركة الألعاب الرياضيّة الإلكترونيّة eSports واسعة
الانتشار، حيث يشاهد مئات الملايين من اللاعبين أبطالهم (البشريين) يلعبون
ألعاب الفيديو سواءً عبر الإنترنت أو من خلال مسابقاتٍ كبيرةٍ تُقام في
ساحاتٍ كبيرة. أشهر لاعبي دوتا 2 ماهرون جدًّا، فهم أشخاص شديدو الثراء
يتدرّبون على اللعب لمدة عشر ساعات في اليوم، لستة أو سبعة أيامٍ في
الأسبوع. بالإضافة إلى ذلك، يحصل هؤلاء اللاعبون على عقودٍ مُربِحةٍ جدًّا
من كفلاءَ مختلفين، مدرّبين محترفين وأخصّائيّين نفسيّين مختصّين بالمجال
الرياضيّ، كما أنهم يتبعون نظمًا غذائيّةٍ وصحيّةٍ خاصّةً، وغيرها من
الميزات التي يحصل عليها عادةً لاعبو كرة القدم أو التنس المحترفون.
لذلك فإن الإنجاز الذي حقّقه الذكاء الاصطناعيّ في تفوّقه على اللاعبين البشريين المحترفين أمثال ديندي Dendi، وسومايل Sumail، وآرتيزي Arteezy يماثل
بأهميته التفوّق على أبطال العالم البشريين في ألعاب الشطرنج، غو وغيرها.
ويؤكّد ذلك كون لعبة دوتا 2 تتضمّن مجالًا واسعًا من خطط واستراتيجيات
اللعب التي تُطبّق على الشاشة في الزمن الحقيقيّ، ممّا يعني أن اللاعبين في
هذه الحالة يمتلكون وقتًا أقلّ بكثير للتفكير مقارنةً بالألعاب الشبيهة
بالشطرنج والتي تعتمد على نظام الدور.
ولكن من الجدير بالذكر أن بوت الذكاء الاصطناعي الخاصّ بـ OpenAI فاز
عند لعبه بنمط اللاعبَين (لاعب مقابل لاعب)، بينما يُلعَب عادةً ضمن فرقٍ
مؤلفةٍ من عشرة لاعبين. كما أن كلّ لاعبٍ بإمكانه اللعب بشخصيّةٍ واحدةٍ
فقط من أصل مئة احتمالٍ موجودٍ في حالات اللعب العاديّة. يُمكن تشبيه ذلك
بالفوز على لاعب كرة سلّةٍ محترفٍ لوحده (لاعب مقابل لاعب) وهي خطوةٌ
كبيرةٌ لكنها مازالت بعيدةً عن الهدف المتمثّل بالانتصار على فريقٍ كاملٍ
من اللاعبين البشريين المحترفين.
بعد فترةٍ قصيرةٍ من المباراة مع ديندي تمّ تحدي أفرادٍ
من الجمهور لإيجاد طرقٍ تمكّنهم من التغلّب على لاعب الذكاء الاصطناعيّ،
مع تقديم جوائز لأوّل خمسين شخصًا يتمكّنون من تحقيق ذلك. حصل على جميع هذه
الجوائز أشخاصٌ اتّبعوا استراتيجياتٍ مبتكرةً جداً وخارجةً عن المألوف لم
يسبق للاعب الذكاء الاصطناعيّ رؤيتها من قَبل، إلا أن قدرته على التعلّم
والتأقلم ستجنّبه ارتكاب الأخطاء ذاتها مجدّدًا.
ما هدف الاستثمار في أبحاث الذكاء الاصطناعيّ المرتبطة بالألعاب
سبب استحواذ هذا الموضوع على اهتمام الشركات البرمجيّة العملاقة هو أن ألعاب eSports تقدّم
مقياسًا سهلًا للأداء يجذب اهتمام العامّة بشكلٍ كبيرٍ. بدأت هذه الشركات
باستثمار مبالغَ كبيرةً في الأبحاث للفوز بالألعاب منذ أكثر من عشرين عاماً منذ فوز ديب بلو Deep Blue الخاصّ بشركة IBM على بطل العالم في الشطرنج غاري كاسباروف Garry Kasparov.
مع أنّ تحقيق هدف "ذكاء اصطناعيّ عام" يُقارن بذكاء
البشر ليس بالأمر البسيط، إلا أنّ الفوز الذي حُقِّق في لعبة دوتا 2 كما في
ألعاب أخرى سابقًا يمكن أن يكون مؤشرًا لتطوراتٍ مختلفةٍ مثيرةٍ للاهتمام.
لا يبحث مطوّرو ومصمّمو الألعاب عن تقنيّة ذكاءٍ
اصطناعيٍّ يقتصر عملها على الفوز باللعبة فقط بل أيضًا جعل اللعبة أكثر
متعةً أيضًا. توفّر هذه الألعاب طريقةً فريدةً لفهم تصرفات الأشخاص، وعلى
وجه الخصوص كيفيّة تفاعل العقلية البشريّة مع تصرفات الذكاء الاصطناعيّ. من
خلال تسجيل البيانات الخاصّة بملايين اللاعبين، وهو ما يحدث في مخابر
الإبداع الرقميّ في بريطانيا UK’s Digital Creativity Labs،
بإمكاننا إجراء تجربةٍ نفسيّةٍ ضخمةٍ عبر الإنترنت يمكن من خلالها استنتاج
ما الذي يريد الناس من الذكاء الاصطناعيّ، وفي نفس الوقت إجراء أبحاثٍ على
تقنيات ذكاءٍ اصطناعيٍّ جديدةٍ.
علاوةً على ذلك، تطوير ذكاءٍ اصطناعيٍّ قادرٍ على تعلّم
كيفيّة اتّخاذ القرار الأفضل في الألعاب من الممكن أن يكون مفيدًا بدوره
في تطوير ذكاءٍ اصطناعيٍّ قادرٍ على اتّخاذ قراراتٍ استراتيجيّةٍ مختلفةٍ
في العالم الحقيقيّ. فقد تعلّم بوت الذكاء الاصطناعيّ الخاصّ بلعبة دوتا 2
"التابع" الذي يمّده بالاستراتيجيّات المناسبة لأيّ موقفٍ من مواقف اللعبة.
وبشكلٍ مشابه، بإمكاننا تخيّل برامجَ ذكاءٍ اصطناعيٍّ تتعلّم توابعَ
خاصّةً بحالاتٍ اقتصاديّةٍ، بيئيّةٍ أو صحيّةٍ معيّنةٍ، كحالات الركود
الاقتصاديّ أو تفشّي مرضٍ ما، حيث ستقوم تلك التوابع بتوليد استراتيجياتٍ
فعّالةٍ للتعامل مع هذه المواقف تكون قادرةً على اتخاذ القرارات المناسبة
من النواحي الحكوميّة أو الاقتصاديّة.
إحدى سلبيات هذا النوع من الذكاء الاصطناعيّ القادر على
اتّخاذ القرار هو عدم قدرته على إخبارنا سبب قيامه بخطوةٍ معيّنةٍ. مع أن
الذكاء الاصطناعيّ يستطيع مساعدتنا على اتّخاذ قراراتٍ أفضل في المسائل
الاستراتيجيّة المعقّدة التي نواجهها، إلا أنّنا مازلنا بحاجة وجود العنصر
البشريّ ضمن حلقة القرار لمعالجة النواحي الأخلاقيّة والاجتماعيّة من تلك
المسائل، وهذا ما يجعل عمل البشر والذكاء الاصطناعيّ سويّةً أمرًا في غاية
الأهميّة.
التعليقات على الموضوع