<<
>>

15.2. Модель эволюции кооперации

Рассмотрим модель "Дилеммы заключенного" в динамике, предполагая, что социальное взаимодействие носит не разовый характер, а может неоднократно повторяться в будущем. В так называемой итеративной дилемме заключенного предполагается, что стороны, принимая решения, учитывают опыт прошлых взаимо-действий и прогнозируют возможное поведение партнеров в будущем.

При этом таблица выигрышей остается неизменной.

Исследованию этой модели посвящена книга P. Аксельрода "Эволюция кооперации" [5], центральной проблемой которой является выявление и анализ механизмов, формирующих кооперативное поведение среди эгоистических индивидов без какого-либо принуждения или указаний свыше. Ясно, что кооперативные механизмы возникают только при определенных условиях. При-

276

мерами являются взаимодействие государств на международной арене, компромиссы, достигаемые сторонниками противоборствующих партий в парламенте, соблюдение неписаных правил поведения в бизнесе и т.д.

Анализ дилеммы заключенного, проведенный в § 15.1, показал, что следование принципам индивидуальной рациональ-ности заставляет "разумных" игроков отказываться от кооперации, выбирая вариант (D; D).

Что же меняется, если с данным партнером социальные взаимодействия могут повторяться? Допустим, стороны знают, что игра повторится ровно десять раз. Казалось бы, целесообразно перейти к взаимному сотрудничеству (вариант С; С), приносящему существенно больший выигрыш. Однако игрок А считает иначе. Он думает, что партнер В будет все время выбирать кооперацию и решает попытаться выиграть, обманывая в последней, десятой игре. Также рассуждает игрок В. Понимая, что оба в последней игре выберут альтернативу D, игроки, обдумывая свою стратегию в девятой игре, приходят к тому же выводу и т.д. Таким образом, рациональной вновь оказывается стратегия D — отказ от сотрудничества.
Каждому из игроков эта стра-тегия принесет по 10 руб., тогда как сотрудничество дало бы каждому по 30 руб. Противоречие между индивидуальной и коллективной рациональностью сохранилось.

Ситуация коренным образом меняется, если игроки не знают, когда закончится игра. Какой же стратегии целесообразно придерживаться в данном случае?

Дать теоретически обоснованный ответ на этот вопрос довольно трудно, и Аксельрод предложил своим коллегам выявить лучшую стратегию в честном спортивном соревновании. Ведущие специалисты, занимающиеся этой проблематикой,— психологи, экономисты, математики, социологи — прислали AK-сельроду свои варианты стратегии данной игры, реализованные в виде компьютерных программ. В турнире участвовали 63 программы. Каждая пара программ проводила друг с другом серии по 200 игр. Точное число игр авторам программ не сообщалось. Присланные программы содержали как простые стратегии, так и весьма изощренные, использующие методы прогнозирования и искусственного интеллекта. Победителем объявлялась программа, набравшая в турнире больше всего очков. Удивительно, что чемпионом оказалась самая короткая программа, присланная А. Рапопортом, реализующая самую простую стратегию "Зуб за зуб" (TIT FOR TAT, сокращенно TFT).

277

Стратегия TFT на первом ходу выбирает кооперацию, а затем просто повторяет ходы партнера. Если он в предыдущей игре выбрал обман (D), то TFT также выбирает обман. Если партнер в предыдущей игре предпочел кооперацию (С), то TFT также считает необходимым его поддержать.

Стратегия "Зуб за зуб" была хорошо известна еще в древние времена. Ей соответствует "золотое правило" Конфуция и нравственные императивы многих религий. Исследования показывают, что в эволюционном плане именно такая стратегия оказывается наиболее эффективной, постепенно обучая социум механизмам кооперации*.

Отметим, что эволюционно эффективная стратегия не обязательно побеждает в каждом поединке с другими стратегиями. Более того, очевидно, что стратегия обмана, отказа от сотрудничества в каждой игре в принципе не может проиграть ни одного поединка.

Но и очков эта стратегия приносит немного. Особенность турнира состоит в том, что лучше проиграть поединок со счетом 500:600, чем выиграть со счетом 200:100 очков. В этом случае понятно, что победить в турнире может стратегия, проигравшая абсолютно все личные поединки; это произойдет, если другие стратегии, встречаясь между собой, наберут относительно немного очков.

Анализ хода партий показал, что обычно стороны за первые I несколько десятков ходов пытаются понять партнера, варьируя I выбор альтернатив. Затем стороны выходят на стационарное со- I стояние, т.е. выбирают один из вариантов (С;С либо D;D) и еле- I дуют ему до конца поединка. Ясно, что победителем турнира I оказывается программа, быстрее других обучающая партнеров I действовать кооперативно. Именно такой оказалась стратегия "Зуб I за зуб", несмотря на то, что многие участники турнира специ- I ально готовились к борьбе с ней. I

Аксельрод считает, что из результатов турнира следуют пра- I вила житейской мудрости: I

• не будь завистлив; I

• не обманывай первым; I

• проявляй взаимность и в сотрудничестве и в обмане; I

• не будь слишком умным. I

Отношение к социальному взаимодействию, как к игре с нуле- I

вой суммой (сколько один выиграл, столько другой проиграл) яв- I

* Это утверждение верно при условии, что вероятность повторной встречи I

партнеров близка к 1. Кроме того, должно выполняться соотношение I

R > (T+S)/2. I

278 I

ляется достаточно распространенным стереотипом. Однако в реальной жизни часто встречаются ситуации, в которых следование эгои-стическим стратегиям неэффективно, что и доказывает исследование модели "Дилемма заключенного" для двух партнеров. Еще более интересные ситуации возникают при участии в играх п лиц.

В июне 1983г. Д.Хофстадтер озадачил читателей журнала "Scientific American", предложив им сыграть в игру с призовым фондом 1 млн (106 ) долларов. Участники игры должны были прислать в редакцию журнала открытку с указанием какого-либо одного числа.

Победителем будет тот, кто пришлет открытку с наибольшим числом. Игра "Наибольшее число" имеет очень любопытное правило награждения: победитель, назвавший наибольшее число N, получает выигрыш, равный, 106 /N. Остальные же участники не получают ничего. Если победителей будет двое, то выигрыш делится пополам. Таким образом, выигрыш вычисляется по следующей формуле: P/Nm, где P—призовой фонд, N—наибольшее названное число, т—число участников, выбравших число N.

В игре приняло участие около 1000 читателей. Почти все прислали открытку с числом 1. Если бы так поступили все, то выигрыш каждого составил бы примерно 1000 долларов. Однако более предприимчивый читатель рассуждал иначе. Он считал, что большинство пришлют числа 1, 2, может быть, 3 и поставил в открытке число 10, рассчитывая получить 100 000 долларов, оставив остальных с носом. Но таких предприимчивых оказалось довольно много. Более того, 33 человека прислали число 106 , надеясь получить хотя бы 1 доллар. Однако несколько энтузиастов прислали числа порядка 10100 , сделав выигрыш исчезающе малым.

Моделям игр с участием п лиц посвящена обширная литература, в которой исследуются механизмы кооперирования, образования коалиций, процессы самоорганизации [1, 3, 6, 8]. В этих моделях исследуются условия возникновения социального порядка в условиях, когда участники не имеют полной информации о предпочтениях друг друга.

<< | >>
Источник: Ю.М. Плотинский. Модели социальных процессов. 2001

Еще по теме 15.2. Модель эволюции кооперации:

  1. КООПЕРАЦИЯ
  2. Дух кооперации как характеристика деятельности групп в организации.
  3. ЭВОЛЮЦИЯ
  4. Модель личности журналиста: профессиональные, социально-гражданские, нравственные, психологические и социально-демографические характеристики. Модификация общей модели для разных специализаций (репортер, аналитик, расследователь, публицист, ведущий-модератор и т.п.).
  5. 15.10.2. Меметическая эволюция
  6. Типологическая эволюция периодики в XX в.
  7. 15.10. ЭВОЛЮЦИЯ ПРОДОЛЖАЕТСЯ
  8. СОЗНАТЕЛЬНАЯ ЭВОЛЮЦИЯ
  9. Эволюция
  10. Смысл жизни, эволюция
  11. Эволюция и позитивные чувства
  12. Три стадии эволюции
  13. Общественная эволюция и социальная структура