شعار قسم ميدان

التعلم الذاتي للآلة.. عندما يتفوق التلميذ على الأستاذ

ميدان - الذكاء الاصطناعي Artificial intelligence

يبدو أن خوارزميات الذكاء الاصطناعي تمتلك صفة بشرية آخذة بالاختفاء تتمثّل في الصدق. ففي وقت كان فيه "مارك زوكربيرغ" يدافع عن ذكاء الآلة ويندد بالأصوات التي ترفع درجة التأهب ضدّه، قامت تلك الخوارزميات بتطوير لغة خاصة بها لا يفهمها البشر، في تهديد قد يكون ذا خطورة أكبر في المُستقبل القريب. ولا يُمكن أبدًا مُعاملة هذا النوع من الخوارزميات معاملة الحمل الوديع، فما يُمكنها القيام به عظيم جدًا، ولعل تحدّيها لأبرز العقول البشرية والتغلّب عليهم أفضل مثال لمعرفة القدرة الخارقة للآلة عندما تُمزج مع الذكاء والتعلّم الذاتي.

 

لمسة فنّية
آخر ما توصّلت إليه الأبحاث في مجال الذكاء الاصطناعي كان فنّيا بحتا، فبعد دلائل على صفة الصدق في الآلة، يُمكن القول وبثقة أن ذوقها الفنّي عالٍ جدًا وستتحدى به الإنسان أيضًا بعد سنوات. في جامعة "ستانفورد" (Stanford) قام فريق من الباحثين بتطوير خوارزميات ذكية لرسم مشاهد حقيقية(1). وهذا بعد أن قدّموا للآلة أكثر من 3000 صورة لمدن مُختلفة حول العالم من أجل تحديد العناصر الموجودة في الصور كالأبنية، والطُرقات، والإشارات الضوئية وما إلى ذلك. فمع كثرة الأمثلة، تُحاول الخوارزميات الوصول إلى أشكال تُحاكي الواقع، أو تُحاكي على الأقل الأمثلة التي قُدّمت لها.

 

أما النتيجة النهائية فكانت مشاهد مرسومة خلال أجزاء من الثانية فقط. وبحسب فريق الباحثين في هذا المشروع، فإن المستخدم سيكون قادرًا في المُستقبل على نطق الأمر التالي "ارسم لي مجموعة من الأبنية مع طريق عام"، ليقوم الحاسب فورًا بتنفيذ الأمر وتقديم النتيجة النهائية، ولن يحتاج مُخرجو الألعاب بعد ذلك لقضاء ساعات طويلة لرسم وتصميم المناظر والمشاهد مع وجود مثل هذه الخوارزميات. أما الهدف النهائي، بحسب أحد العاملين في المشروع، فهو بناء لعبة كاملة للحواسب، وكما هو معلوم، لكل لعبة بيئتها الخاصّة، وهذه ستكون مهمّة الحواسب في المُستقبل، ولن يتدخّل الإنسان سوى بتحديد بعض الضوابط.

  undefined

على اليمين صورة من لعبة "جي تي أيه" (GTA)، وعلى اليسار الصورة التي قامت الخوارزميات بإنشائها.

  

إيلون ماسك و"دوتا 2″
لا يُمكن الحديث عن الذكاء الاصطناعي دون إقحام "زوكربيرغ"، و"إيلون ماسك" (Elon Musk)، الذي يُعتبر الواعظ في هذا المجال ويُطالب بتنظيم تطوير مثل هذا النوع من التقنيات لأن خروجها عن السيطرة قد يكون ذا عواقب وخيمة. "ماسك" يمتلك مؤسّسة غير ربحية مُتخصّصة في مجال الذكاء الاصطناعي تُعرف بمختبرات "أوبن أيه آي" (OpenAI)، والتي كان آخر نتاجها برمجية ذكية قادرة على لعب "دوتا 2" (Dota 2)، اللعبة الإستراتيجية الشهيرة.

 

لعب "دوتا 2" لا يعني تشغيلها وبناء قاعدة فيها والانتقال من مكان لآخر على الخارطة. بل يعني قدرة تلك البرمجية في التغلّب على أبطال العالم فيها، والذين كان آخرهم "ديندي" (Dendi) أحد أهم المُتخصّصين في هذه اللعبة والذي يُنافس في بطولات عالمية على غرار بطولة "فالف" (Valve) السنوية التي كانت مسرح الجريمة البشعة(2)، والذي قال بعد خسارته إن شعوره مُتناقض نوعًا ما، فالبرمجية بدت وكأنها إنسان من جهة، وكأنها شيء آخر من جهة أُخرى.

  

  

احتاجت البرمجية الذكية أسبوعين فقط داخل مُختبرات "أوبن إيه آي" قبل أن تكون جاهزة لذلك النزال الذي فاجئ الجميع دون استثناء، خصوصًا أن لعبة بحجم "دوتا 2" فيها مجموعة كبيرة من الشخصيات تصل إلى 113، كل واحدة منها لديها ميّزات ونقاط قوة مُختلفة عن البقيّة. كما يُمكن تطوير قدرات تلك الشخصيات كذلك من خلال بعض العناصر، وهذا يعني عددا غير مُنتهي من الاحتمالات التي يحتاج الإنسان قبل الآلة لإتقانها وفهمها بالشكل الصحيح.

 

خلال ساعاتها الأولى داخل المُختبر، قامت تلك الخوارزميات بتجربة آلية التغلّب على ذاتها، أي أنها كانت تُنشأ لعبة مع نسخة أُخرى منها وتتحدّى نفسها كل مرّة للوصول إلى أفضل الخطوات للفوز بشكل دائم، لتُصبح جاهزة بعد ساعات قليلة للعب ضد أي شخص. لكنها وبعد أسبوعين من التمارين المُستمرّة وصلت للمستوى الذي قارعت به أفضل لاعبي العالم، وتغلّبت عليهم أيضًا.

 

لتحرّي الدقّة، تم تقييد تلك الخوارزميات بشخصية واحدة من الـ 113، أي أنها أتقنت شخصية واحدة فقط. كما أنها قادرة على اللعب ضد الشخصية نفسها كذلك، لكن ما رُصد أثناء اللعب كان غريبًا. كانت تلك الخوارزميات قادرة على خداع اللاعب الآخر والقيام بحركات توهمه أنها ستقوم بشيء، لتقوم بشيء آخر عكس ذلك؛ كاشفة قاعدة خصمها للقضاء عليه بسهولة تامّة. وهذا بعد اتّباع الكثير من الإستراتيجيات للوصول لمبتغاها.

  undefined

 

احتفى "ماسك" بهذا النجاح عبر حسابه في تويتر(3) ذاكرًا أن هذا يُمثّل تقدّمًا كبيرًا في مجال الذكاء الاصطناعي وتعلّم الآلة، مُسلّطًا الضوء على الخطوة المُقبلة التي تتمثّل في خوض نزال رسمي كامل في "دوتا 2" مؤلّف من خمسة لاعبين ضد خمسة، أيًا كانت الشخصيات المُختارة، وهو نزال سيجري بنسبة كبيرة في نسخة العام القادم من بطولة "فالف" السنوية التي تجذب أفضل المواهب على مستوى العالم.

 

غوغل
يعتمد جزء كبير من تعلّم الآلة على مُدخلات يتم تقديمها للحاسب، وعلى آلية التجربة والخطأ للتعلّم، إذ تنتهي مهمّة الإنسان بمجرّد تقديم المدخلات، لتتكفّل الآلة بكل شيء بعد ذلك من خلال تجربة الحلول ورصد حالات النجاح لتسجيلها وتكرارها فيما بعد. ومثال بسيط على هذا الأمر هو خوارزميات لعبة "إكس أو" أو "تيك تاك تو" (Tic Tac Toe).
 

 undefined

 

تقوم الآلة بعد كل خطوة بدراسة احتمالات النجاح، وهذا يعني أنها عند بداية اللعبة، أي عندما تكون الحقول فارغة، تقوم باختبار وضع علامتها في كل حقل من الحقول التسعة وذلك بناءً على الحقل الذي يُمثّل أعلى نسبة نجاح. وبعد أن يضع المنافس علامته في حقل ما، تقوم من جديد بدراسة الحقول المُتبقّية وتجربة وضع علامتها في كل منها، فمثلًا لو كانت الرقعة الأولى من السطر الثاني فارغة، تختبر وضع علامتها هناك وتدرس الأماكن التي سيقوم المنافس بوضع علامته فيها، لتقوم أيضًا بدراسة الاحتمالات التي تبقّت لها بعد الخطوات المتوقّعة للمنافس، وبناءً عليه تختار المكان الأمثل(4).

 

طبعًا عند الحديث عن لعبة بحجم "تيك تاك تو" فإن حجم الاحتمالات محدود، فهناك تسعة حقول فقط، وعلامتين إما "إكس" (X) وإما "أو" (O). وبالتالي شجرة الاحتمالات بسيطة يُمكن لخوارزميات تعلّم الآلة حسابها خلال أجزاء من الثانية واختيار الأفضل منها بعد الذهاب لنهاية اللعبة المُحتملة مع كل خطوة تقوم بها.

 

عند الحديث عن لعبة الشطرنج، فإن فضاء الاحتمالات سيُصبح أكبر وأوسع، وهو شيء لن تكون الخوارزميات قادرة على القيام به مع كل خطوة. لكن ومع وجود قدرة معالجة عالية في الحاسب، يُمكن أيضًا اللجوء للتكتيك نفسه، ودراسة الحركات المُمكنة لتحقيق الفوز، لاتخاذ القرار بناءً على ذلك. لكن هذا شيء غير مُمكن في لعبة بحجم "غو" (GO)، وهي رقعة مُربّعة مؤلّفة من 19 x 19 خانة، وأحجار ملوّنة باللونين الأبيض والأسود.

  

  

لعبة "غو" مثّلت تحدّيا كبيرا بالنسبة للعُلماء، وخصوصًا العاملين في شركة "ديب مايند" (DeepMind)، وهي مُختبرات داخل شركة ألفابت تعنى بالذكاء الاصطناعي وتطبيقاته المُختلفة والتي تمكّنت من تطوير برمجية ذكية تغلّبت على أبطال العالم في هذه اللعبة التي تستغرق الجولة الواحدة منها في بعض الأوقات خمس إلى ست ساعات تقريبًا.

 

في (مارس/آذار) 2016، جلس بطل العالم في لعبة "غو"، الكوري "لي سيدول" (Lee Sedol)، على الطاولة نفسها مع برمجية "ديب مايند" ليصطدم بمستوى غير مسبوق أبدًا من الذكاء، فبعد حذر من الطرفين مع بداية اللعبة، أيقن "سيدول" أن ما شاهده خلال سنواته الطويلة والذي ساهم في تحقيقه لبطولة العالم ليس سوى جزءًا من الذي سيشاهده خلال اللعب مع تلك البرمجية الذكية(5).

 

تمكّنت البرمجية من التغلّب على "سيدول" في ثلاث جولات متتالية، لكنها اقترفت خطأ في الجولة الرابعة، استغلّه "سيدول" بنجاح وتمكّن من الفوز. إلا أن تلك الجولة لم تمر مرور الكرام بالنسبة للآلة وبرهنت أنها قادرة على التعلّم من أخطائها بشكل شبه فوري، فهي عادت في الجولة التي تليها وفازت لتُحقّق الفوز في المباراة بواقع 4-1، ويخرج "سيدول" مذهولًا(6).

 

يعلم الجميع مكانة، ودهاء، "سيدول" في لعبة "غو" على مستوى العالم، ولهذا السبب لم تتزعزع ثقة ألفابت به حتى بعد الخسارة، لأن استغلاله لخطأ الآلة والفوز بجولة أفضل بُرهان على قدراته العالية. وبناءً على ذلك، تعاونت مختبرات "ديب مايند" مع "سيدول" لزيادة مستوى الذكاء في برمجية اللعبة، أملًا في تعلّم خدع جديدة لهزيمة الجميع دون استثناء. وبعد عام من التجارب والاختبارات، جلس الصيني "كي جي" (Ke Jie)، أحد أبرز الأسماء في لعبة "غو" وجهًا لوجه مع البرمجية بعد التطوير، ليجد نفسه خاسرًا بواقع ثلاث جولات مُتتالية ويخرج دون حراك. لكن مُختبرات "ديب مايند" قرّرت إحالة تلك البرمجية للتقاعد بعد إتمام مهمّتها الرئيسية(7)، وهو قرار قبل الخوض في أسبابه يجب فهم آلية عمل تلك البرمجية المعروفة باسم "آلفا غو" (AlphaGo).

  undefined

 
التعلّم الذاتي
جميع البرمجيات الذكية السابقة تعتمد على مبدأ التعلّم الذاتي، أي أنها تدرس وتُجرّب وتُدوّن. كل شيء يجري كأنها طالب في فصل دراسي. ومن الناحية التقنية فإن التعلّم الذاتي عبارة عن مجموعة طبقات من الشبكات العصبونية المُترابطة فيما بينها، مع وجود أدوات لتعليم تلك الشبكات. الطبقة الواحدة عبارة عن مصفوفة من الأرقام، تستقبل مصفوفة مُدخلات من المُستخدم ثم تقوم بدراستها وتحاول الخروج منها بنمط مُكرّر. تلك العملية، وبالجمع بين جميع الطبقات، تُمثّل ما يُعرف بالعقل الرقمي(8).

 

يُمكن لخوارزميات غوغل مثلًا معرفة العناصر الموجودة داخل الصور. لكن تلك العقول الرقمية في بداياتها قُدّمت لها ملايين الصور لكل عنصر؛ فمن أجل تعليمها شكل القطّة، يتم تقديم صور مُختلفة التعقيد تحتوي على قطّة، أو مجموعة من القطط. لتُصبح الآن، وبعد سنوات من التدريب، قادرة على معرفتها خلال أجزاء من الثانية فقط.

 

في خوارزمية "آلفا غو" على سبيل المثال تم اللجوء لاستخدام عقلين عوضًا عن واحد(9)، الأول لتحديد الخطوة المُقبلة، والثاني لتقييم جودتها. عندما يحين دور البرمجية للقيام بالخطوة التالية أمام المُنافس، تقوم بالاطلاع على رقعة اللعب ومعاملة الأحجار الموجودة عليها وكأنها مصفوفة لدراسة الخطوات المُتاحة. بعدها يتم دراسة جدوى كل خطوة مُتاحة لتحديد الأفضل من بينها للوصول للغاية النهائية، المُتمثّلة بالفوز.

 

كيف يختار ذلك العقل الخطوة المُقبلة؟ عن طريق النماذج السابقة التي تدرّب عليها والتي قدّمها العاملون في المُختبرات، وهي خطوات قام بها أعظم اللاعبين في حالات مُشابهة. وبحسب الدراسة التي أُجريت على "آلفا غو"، رُصد اختيارها لحركات الإنسان الناجحة نفسها بنسبة 57٪. لكن ولزيادة نسبة النجاح والابتعاد عن تقليد الإنسان فقط، قام فريق العمل بفتح باب التعلّم أمام تلك البرمجية من خلال تحدّي نفسها، تمامًا مثلما قام فريق "أوبن إيه آي" لتعليم الآلة طريقة لعب "دوتا 2″، وهذا يُفسّر كون خطواتها تُشابه الإنسان من جهة، وشيء آخر من جهة مثلما قال "ديندي".

  

التعلّم الذاتي وخوارزميات الذكاء الاصطناعي بدأت قبل سنوات بتطبيقات بسيطة، وأصبحت ذو تعقيد أكبر في الوقت الراهن، لتكون قادرة في المُستقبل على مُساعدة الإنسان في حياته
التعلّم الذاتي وخوارزميات الذكاء الاصطناعي بدأت قبل سنوات بتطبيقات بسيطة، وأصبحت ذو تعقيد أكبر في الوقت الراهن، لتكون قادرة في المُستقبل على مُساعدة الإنسان في حياته
  

بالعودة للعقل الثاني الخاص بتقييم جودة الخطوة، فإن وظيفته هي النظر إلى الخانات المفتوحة ودراسة مُساهمتها النهائية في الفوز باللعبة، وهذا بشكل تقريبي، لكنه يُساعد العقل الأول في تحديد الخطوة المُقبلة بسهولة أكبر، من خلال استبعاد الخطوات ذات التقييم المُنخفض. وبهذا الشكل يبدأ عمل خوارزميات "آلفا غو" بتحديد الخطوات المُقبلة المُحتملة عن طريق العقل الأول، ومن ثم تقييم كل احتمال من تلك الاحتمالات عن طريق العقل الثاني. لكنها تستمر في القراءة حتى دون القيام بالخطوة لدراسة جدوى الخطوات التي تليها، أي أنها تعتمد على ثقل وقوّة الخطوات المُحتملة بعدها، وليس فقط على جدواها في المرحلة الحالية(10).

 

فاكهة الأبحاث
من أجل اختيار الخطوة المُقبلة، تذهب تلك الخوارزميات أو العقول للنهايات الناجحة، وتحاول دراسة أفضل الطرق للفوز ولا شيء سوى ذلك، وهو أمر قد يكون مُمكنا بشكل نظري بالنسبة للإنسان، لكن وبشكل عملي لا يُمكن القيام بهذا الأمر بشكل دائم.

 

هذا يُفسّر إحالة برمجية "آلفا غو" للتقاعد، فمُهندسي الشركة ذكروا أنها أتممت غايتها الرئيسية، وبالتالي ستوضع تلك النتائج والتقنيات في مجالات أُخرى مثل البحث عن مُسبّبات الأمراض المُستعصية من خلال دراسة نشأتها ومحاولة العثور على نموذج يتكرّر كل مرة قبل وبعد الإصابة بالمرض. بعدها وفي حالة رصد النمط يُمكن البدء في اختبار العقاقير، أو اختبار ردود أفعال الخلايا المُصابة، وكل هذا عن طريق أنظمة حاسوبية ودون تدخّل الإنسان. كما أن ذكاء الآلة قد يُساهم في تقليل الوقت اللازم للوصول للنتائج النهائية لأنه قادر على رصد ما يحدث للخلايا مع مرور الوقت سواءً بوجود العقار الطبّي أو من دونه، ليُحدّد جدوى تلك الطريقة من عدمها.

 

عندما بدأت الحواسب بالظهور، كانت الغاية الرئيسية منها إجراء عمليات حسابية بدأت بسيطة، وازداد تعقيدها مع مرور الوقت. الأمر نفسه يتكرّر مع التعلّم الذاتي وخوارزميات الذكاء الاصطناعي، فهي بدأت قبل سنوات بتطبيقات بسيطة، وأصبحت ذو تعقيد أكبر في الوقت الراهن، لتكون قادرة في المُستقبل على مُساعدة الإنسان في حياته، وهي الغاية الأسمى لذكاء الآلة بالنسبة لمجموعة كبيرة من الشركات.

المصدر : الجزيرة