<<
>>

Стратегическая рефлексия агентов.

Одним из основных вопро- „ 37 сов теории игр является моделирование того, какие действия из- берут агенты (или иначе — какие действия им надо избрать) в той или иной ситуации. «Устойчивый» в том или ином смысле набор действий агентов обычно называется решением игры, что подчеркивает важность данного аспекта.
Поскольку выигрыш (значение целевой функции) агента зави- сит от действий других агентов, постольку выбор агента в большой степени зависит от того, как он учитывает (или не учитывает) воз- можные рассуждения оппонентов о выборе ими своего действия, т. е. как он осуществляет стратегическую рефлексию. Агент мо- жет, например, при принятии решения вообще не учитывать дей- ствия оппонентов, основываясь лишь на своей целевой функции (нулевой ранг стратегической рефлексии). Если так действуют все агенты, то мы получаем концепцию максимального гаранти- рованного результата решения игры — каждый агент максими- зирует свой наихудший результат при всевозможных действиях оппонентов. Если агент считает, что оппоненты обладают нулевым рангом, то сам он обладает первым рангом стратегической рефлексии. При этом он выбирает свое наилучшее (т. е. максимизирующее целевую функцию) действие, ожидая от оппонентов выбора гарантирующих действий. Если агент считает, что оппоненты выбрали второй ранг стра- тегической рефлексии, то сам он обладает третьим рангом и т. д. Таким образом, обладая к-м рангом, агент считает, что оппоненты обладают (к — 1)-м. Выбирая любой ненулевой конечный ранг ре- флексии, агент считает себя рефлексирующим иначе, чем оппо- ненты. Выбирая равновесие Нэша, агент считает всех участников игры рефлексирующими одинаковым образом. Рассмотрим игру двух участников, число действий каждого из которых конечно. Как известно, такие игры называются бима- тричными, и целевые функции первого и второго агентов в них обычно задаются матрицами А = (а^) и В = (Ьу), вместе соста- вляющими матрицу игры (А, В) = {а^,Ъц). Обозначим / = {1,2— множество действий первого агента, J = {1,2,..., гг} — множество действий второго агента. Введем следующие предположения. Пусть матрицы выигрышей таковы, что у каждого агента существует единственный наилуч- ший ответ на любое действие оппонента: (здесь и далее за \М\ обозначено количество элементов множе- ства М). Пусть, кроме того, максимальный гарантированный результат каждого агента достигается ровно на одном действии: Условия (10) и (11), обеспечивающие однозначное соответствие между рангом рефлексии агента и его действием, далее будем счи- тать выполненными. Как было сказано выше, каждый агент может выбрать конеч- ный ранг свой рефлексии. Это приводит к выбору соответству- ющего действия: обладая нулевым рангом, первый агент выби- рает гарантирующую стратегию — действие io = arg шах min ац, iei а обладая рангом к ^ 1 — действие Л = argmaxayfc_1. iei Аналогично для действий второго агента: jo = arg max min bij jeJ при нулевом ранге, jk = arg max bik_1 j при ранге к ^ 1. jeJ Справедливо следующее утверждение. Утверждение 3.13 [80]. В биматричных играх неограни- ченное увеличение ранга рефлексии заведомо нецелесообразно, т. е. существует ранг рефлексии, превышение которого не приводит к новым действиям агентов. Максимальный целе- сообразный ранг рефлексии не превышает max {min {n, т + 1}, min {т, п + 1}}. Из утверждения 3.13 следует, что множество допустимых дей- ствий по выбору ранга конечно. Поэтому мы можем перейти из ис- ходной игры к игре рангов стратегической рефлексии, в которой стратегией агента является выбор ранга стратегической рефлек- сии (см. табл. 4).
Таблица 4. Ранги рефлексии и действия агентов

Верхняя оценка количества возможных попарно-различных пар стратегий составляет Л = |/| х | ф гии. Без ограничения общности предположим, что и = шах [и, и', и"]. Поскольку в равновесии дей- ствие агента является наилучшим ответом на действие оппонента, справедливы следующие соотношения: iu = iv+\ = iu+2 = iy+3 = = iu+4 = • • jv = ju+l = jv+2 = • • • Аналогичные соотношения верны для iui, iun. Следовательно, iu+i = iu>, iu = iu"- Но тогда iu = iu"- Полученное противоречие доказывает утверждение 3.16. Следует отметить, что в некоторых случаях любой исход игры рангов дает обоим игрокам лучший результат, чем равновесие. Приведем пример такой биматричной игры. Пример 3.32. Пусть /(6,10) (0,0) (10,6)\ (0,0) (5,5) (0,1) . \(Ю, 6) (1,0) (6,10)/ Равновесие приводит к паре выигрышей (5,5), что хуже (для обоих агентов) любого из исходов игры рангов: /(6,10) (10,6)\ 1(10,6) (6,10) у

<< | >>
Источник: Д.А. Губанов, Д.А. Новиков, А.Г. Чхартишвили. СОЦИАЛЬНЫЕ СЕТИ: МОДЕЛИ ИНФОРМАЦИОННОГО ВЛИЯНИЯ, УПРАВЛЕНИЯ И ПРОТИВОБОРСТВА. 2010

Еще по теме Стратегическая рефлексия агентов.:

  1. Глава 9. СТРАТЕГИЧЕСКИЕ УСТАНОВКИ МАРГИНАЛА
  2. А. Г. Пирогов. Стратегические подходы в практике гипноза, 2009
  3. Стратегическая линия сбалансирования
  4. Вредоносный, опасный агент
  5. Вредоносный, опасный агент
  6. АГЕНТ
  7. Сложность вредоносного агента (предмета, средства)
  8. Сложность вредоносного агента (предмета, средства)
  9. Очерк 1: Кэтлин «Стратегические планы — вот это меня увлекает до чертиков!»
  10. РЕФЛЕКС УСЛОВНЫЙ
  11. РЕФЛЕКС БЕЗУСЛОВНЫЙ
  12. РЕФЛЕКС УСЛОВНЫЙ: ГЕНЕРАЛИЗАЦИЯ
  13. РЕФЛЕКС
  14. РЕФЛЕКСИЯ
  15. РЕФЛЕКС ОРИЕНТИРОВОЧНЫЙ
  16. Статья 326. Нарушение правил обращения с микробиологическими или иными биологическими агентами либо токсинами
  17. РЕФЛЕКС ОБОРОНИТЕЛЬНЫЙ