الاثنين، 11 نوفمبر 2013

عن أصل التعاون مرة أخرى -1-

روبرت أكسلورد كان قد حصل على بكالوريوس في الرياضيات قبل أن يحصل على دكتوراة في العلوم السياسية وهو يعمل حالياً أستاذاً للعلوم السياسية في جامعة ميتشيجان درس لسنوات عديدة معضلة نشأة التعاون وأصوله التكيفية مهتما بالصيغة التي ذكرناها في المقال السابق لمعضلة السجين باعتباها حالة مجردة وبسيطة من أشكال النزاع أو اللعبة بين طرفين. بدأ أكسلورد بدراسة المعضلة خلال الحرب الباردة قلقاً من نشوب حرب نووية أو تصعيد متبادل في سباق التسلح (وهو ما حدث فعلاً وانتهى بانهاك أحد الطرفين اقتصاديا وانهياره) كان السؤال الذي طرحه “تحت أي ظروف سوف ينشأ التعاون في عالم من الأنانيين بدون سلطة مركزية؟” يذكر أكسلورد أن فشل أشهر الاجابات التاريخية على هذا السؤال كان هو محركه الأساسي لرفض فكرة فرض التعاون من قبل سلطة خارجية.
كانت الاجابة التي يقصدها هي تلك التي طرحها الفيلسوف الانجليزي توماس هوبز منذ ثلاثة قرون والتي استنتج فيها أن التعاون يمكن ان يتطور فقط تحت وطأة سلطة مركزية تفرضه على الجميع. مرت الثلاثة قرون (والعديد العديد من الحروب) وظلت الاجابة كما هي، وكما صاغها أينشتين في حلمه الطوبوي أن الحل الوحيد لضمان السلام هو وجود حكومة عالمية موحدة وهو ما تم على اساسه تشكيل عصبة الأمم المتحدة ومن بعدها منظمة الأمم المتحدة بلا أي نتيجة ملموسة من الحفاظ على السلام العالمي أو تنظيم التنافس بين المصالح القوميةللأمم المختلفة. ولذا وكنتيجة للفشل التاريخي لهذا الحل تسائل اوكسلورد كيف يمكن أن ينشأ التعاون عن طريق آخر بدون وجود تلك السلطة المركزية وهو ما سوف أحاول تغطيته في المقال الحالي.

نشأة وتطور التعاون

في البداية ولكي نستعيد تلخيص المعضلة أو المفارقة فهي ببساطة لو أن كلاً من الطرفين وسوف نسميهما من الآن فصاعداً اللاعبين اهتم فحسب بمصلحته الشخصية بأنانية فسوف يقود هذا  التفكير بمعزل عن استراتيجية الطرف الآخر الى نتيجة أسوأ من التي كان يمكن أن تنتج عن تعاونهما معاً.
كان السؤال الذي طرحه أكسلورد ماذا لو كانت هذه اللعبة ممتدة ومتكررة هل يمكن ان يتبنى اللاعب استراتيجية تقود في النهاية لنشأة التعاون كبديل؟ وفي هذه الحالة ما هي الشروط التي في ظلها سوف ينشأ هذا التعاون؟ وهل يمكن أن يستمر هذا التعاون ويصمد أمام استراتيجيات أخرى أنانية؟ كان أكسلورد مقتنعا أن استكشاف الاستراتيجيات المختلفة التي يمكن ان يتبعها اللاعبون في لعبة السجن المتكررة يمكن ان يلقي الضوء على الظواهر المعقدة التي تلعب دوراً في السياسة الدولية والعلاقات الاجتماعية بل وحتى في عالم الأحياء.
The Evolution of Cooperationنشر أكسلورد ملخص عمله خلال ما يربو على عشرة أعوام من الأبحاث في كتابه الشديد الشهرة (تطور التعاون Evolution of Cooperation) في عام 1984 والذي سوف نحاول في هذا الجزء والجزء التالي أن نلخص أهم ملامحه.
يبدأ أكسلورد بالتنبيه على أنه يستخدم معنى كلمة التطور والارتقاء Evolution ليس بالمعنى البيولوجي البحت ولكن بالمعنى الاستراتيجي؛ من باب التمهيد للفكرة تخيل طريقة الانتخاب الاصطناعي الذي يتبعه المهجنون ومربو السلالات الحيوانية عندما يريدون تعزيز صفة وراثية بعينها فانهم ينتقون الأب والأم ممن لديهم هذه الصفة ويستمر هذا الانتخاب لتعزيز الصفة المطلوبة عبر الأجيال المتتابعة من الابناء، هذا مشابه لنفس فكرة أكسلورد عن التفكير بنسق تطوري ولكن في سياق اختيار الاستراتيجيات تخيل مثلا عضو مجلس شعب انتُخِب ولم يقدم أي شئ في الدورة التي نجح فيها لأهل دائرته ولا للبلاد فمن غير المرجح أن ينجح مرة أخرى في الانتخابات (وهذا المثال الذي ضربه هو نفسه في الكتاب) ويندرج نفس الشئ على الاستراتيجات المختلفة التي يتبناها لاعبوا معضلة السجين المتكررة؛ فلابد أن الاستراتيجية الناجحة سوف يتم انتخابها عبر الدورات المتكررة للعبة وبقدر نجاح الاستراتيجية بقدر تمسك اللاعب بها والاستمرار عليها المهم هنا أن ما يتعرض للنجاح او الفشل ليس الشخص بذاته بل الشخص باعتباره تجسيداً للاستراتيجية سواءاً كان هذا الشخص عاقلاً أو مجرد فاعل غير عاقل في وضع تنافسي مثل الخلايا التي تتنافس على الموارد أو المؤسسات التجارية التي يتخذ فيها القرار مجموعه من الافراد الذين يضعون تصوراً محددا غير فردي لمصلحة المؤسسة أو الحكومات في العلاقات الدولية.
النقطة الثانية المهمة التي ركز عليها أكسلورد أن اللعبة ليست محدودة في الوقت .. فأي من اللاعبين لا يعرف متى ستنتهي ولا اذا كانت ستنتهي أم لا لأنهم لو كانوا يعلمون متى ستنتهي فان هذا سوف يقضي على كل احتمالات نشوء التعاون بين الأطراف المتنافسة.
قام أكسلورد بتبني اسلوب جديد حينها لدراسة المشكلة وهي استخدام المحاكاة الحاسوبية في المشكلات السياسية فقد طرح الفكرة كمسابقة حاسوبية يقوم فيها رياضيون وعلماء اجتماع بتقديم استراتيجياتهم المقترحة على شكل برنامج كمبيوتر ويقام دورة بين اللاعبين (البرامج) بحيث يلعب كل واحد منهم مع كل اللاعبين الآخرين وفي النهاية يتم تحديد أفضل الاستراتيجيات التي نتج عنها التعاون بغض النظر عن سلوك اللاعب المقابل وموقفه.
ما يركز عليه أكسلورد وما وضعه كقواعد لهذه الجولة الأولى من اللعبة والتي أسماها معضلة السجين المتكررة Iterated Prisoner Dilemma نورده في النقاط الآتية:
  1. لا يوجد طريقة يمكن بها أن يهدد أو يجبر لاعب لاعباً آخر على خطوة بعينها ولكل لاعب حرية اختيار كاملة للاستراتيجية التي سيتبناها
  2. لا يمكن للاعب أن يعرف الخطوة التي سيأخذها اللعب في الطرف المقابل ولذا لا يمكن مثلا اتباع استراتيجية مثل “ افعل نفس الخطوة التي سوف يلعبها الخصم”
  3. لا يمكن للاعب الانسحاب من اللعبة أو اقصاء اللاعب الآخر ( لا بديل عن استكمال اللعبة سواء بالتعاون أو بالأنانية)
  4. لا يمكن للاعب أن يغير المردود المحدد سلفا للاعب آخر فلا يمكن تغيير قيمة الخمس أو العشر سنين للاعب الخصم تحت أي ظرف.

طبقاً لهذه الشروط لا يوجد طريقة للتفاعل بين اللاعبين الا عن طريق اللعبة واتخاذ خطوات اللعب فقط. ما يجعل نشأة التعاون ممكنة هو حقيقة أن اللاعبين أ و ب مثلاً يمكن أن يتقابلا مرة أخرى هذا الاحتمال يعني أن الاختيارات التي سوف يأخذها لاعب ما اليوم لن تحدد فقط الناتج الحالي للعبة ولكن سوف تؤثر كذلك على الاختيارات المستقبلية للاعبين أو كما عبر عنها اكسلورد “ ان المستقبل يلقي بظله على الحاضر” ولكن المستقبل ليس له نفس أهمية القرار الحالي لسببين أولهما: أن الاعبين يعطون قيمة أقل للمكسب المستقبلي منه للمكسب الحاضر والسريع والسبب الثاني ان هناك دائما احتمال ان لا يتقابل اللاعبان مرة أخرى.  لهذه الأسباب لا يمكن أن يكون المردود من خطوة مستقبلية مساوياً للمردود من الخطوة الحالية ولذا وضع اكسلورد قيمة ما يسمى معامل الخصم المستقبلي والذي يمثل أهمية أو وزن الخطوة المستقبلي في مقابل نفس الخطوة لو اتخذت في الوقت الحالي فمثلاً في أول اللعبة لو فرضنا ان اللاعب أ قرر أن يشهد ضد اللاعب ب ( يتصرف بأنانية) سوف يكون مردود الخطوة عليه مثلاً 10 نقاط أما لو اتخذ نفس الخطوة في المرة الثانية في نفس اللعبة سوف يكون مردودها عليه هو ع*10 حيث ع هو قيمة معامل الخصم. اذا فرضنا أن اللعبة ستمتد لما لا نهاية فان مجموع المردود من اتخاذ نفس القرار على التوالي الى ما لانهاية سيكون 10 مقسوما على (1-ع) وبالتالي لو فرضنا أن ع = 0.9 فان المردود الاجمالي من اتخاذ نفس خطوة الانانية الى ما لا نهاية سيكون هو 100 = 10/0.1.
في ظل هذه الشروط وطريقة حساب المردود كان دائماً الرابح هو سياسة (المثل بالمثل) بمعنى في أول اللعبة تعاون ثم بعد ذلك افعل تماما نفس الخطوة التي اتخذها اللاعب المقابل في الخطوة السابقة اذا شهد ضدك اشهد ضده اذا تعاون تعاون.
وسوف نستكمل عرض معنى هذه النتائج وامتداداتها لمجالات مختلفة من الحياة والسياسة وفلسفة الحكم في المقال القادم.

ليست هناك تعليقات:

إرسال تعليق