Шрифт:
Интервал:
Закладка:
Для того чтобы лучше понять концепцию совершенного по подыграм равновесия, заметим, что в представленных здесь примерах комбинации действий, полученные благодаря обратной индукции, удовлетворяют требованию взаимного наилучшего ответа для равновесия Нэша. Оно также удовлетворяет требованию того, чтобы действие игрока 2 было оптимальным в игре, которая началась, когда ему приходилось выбирать действие. Начиная с этой точки принятия решения, обратная индукция ограничивает допустимое множество действий игрока 2 оптимальными действиями.
Однако в динамических играх с одновременными ходами мы, как правило, не можем следовать этой процедуре, потому что оптимальное действие зависит от действия другого игрока. Чтобы понять, почему данное условие ограничивает использование обратной индукции, рассмотрим следующую игру, представленную в расширенной и в нормальной форме (рис. А.7). Игрок 1 первым делает ход, выбирая между А и В. Если игрок 1 выбирает В, игра заканчивается и выигрыши составляют (2, 6). Если игрок 1 выбирает А, оба игрока играют в игру с одновременными ходами, представленными в матрице 2–2. К игре 2–2, которая следует за выбором А игроком 1, не может быть применена обратная индукция с рассмотрением оптимальных ходов либо игрока 1, либо игрока 2.
Иными словами, ни один игрок не делает ход последним, как это происходит в игре с последовательными ходами.
РИС. А.7. Совершенное по подыграм равновесие
Однако мы по-прежнему можем следовать логике процедуры обратной индукции с нахождением равновесия Нэша в играх 2–2 и рассмотрением оптимального выбора игрока 1 между А и В, принимая во внимание этот исход равновесия Нэша. Равновесием Нэша в игре 2–2 является комбинация (C, E), которая дает выигрыши (3, 4). Оптимальным выбором между А и В для игрока 1 является, таким образом, А. Комбинация действий, которую дает эта процедура, – (AC, E), т. е. совершенное по подыгре равновесие. Чтобы увидеть, что эта процедура устраняет равновесие Нэша, основанное на недостоверных угрозах, отметим, что в игре есть три равновесия Нэша: (AC, E), (BC, F) и (BD, F). (BC, F) и (BD, F) дают выигрыши (2, 6), что менее выгодно для игрока 1 и более выгодно для игрока 2, чем совершенное по подыгре равновесие (AC, E). Оба эти равновесия, однако, основываются на недостоверных угрозах, лежащих вне траектории игры. Рассмотрим (BC, F). Если брать игру как целое, выбор С или F не влияет на выигрыши, потому что эти действия лежат вне траектории игры. Но если на самом деле возникнет потребность предпринять такие действия, они не станут взаимным наилучшим ответом. Если игрок 2 выбирает F, лучший ответ игрока 1 – D, а не C, который дает игроку 1 выигрыш в 2 вместо 1. Подобным образом в (BD, F), если игрок 1 выбирает D, лучший ответ игрока 2 – E вместо F, что дает ему выигрыш в 1 вместо 0.
Понятие совершенного по подыграм равновесия использует идею наилучшего взаимного ответа, которая составляет суть равновесия Нэша, применительно к подыграм. Интуитивно понятно, что подыгра – это часть первоначальной игры, которую еще предстоит сыграть, но подыгра начинается только в те моменты, когда полная история того, как уже разыгрывалась данная игра, известна всем игрокам. Равновесие Нэша (в игре в целом) является совершенным по подыгре равновесием, если стратегии игроков образуют равновесие Нэша в каждой подыгре. Каждая конечная игра имеет совершенное по подыгре равновесие.
А.3. Самоподдерживающееся поведение в повторяющихся играх: совершенные по подыграм равновесия, «народная» теорема и несовершенный мониторингДо сих пор мы изучали игры, в которых игроки взаимодействуют только один раз. Однако институциональный анализ занимается повторяющимися ситуациями, в которых индивиды взаимодействуют во времени. Один из способов изучения таких ситуаций – использование динамических игр с более сложными древами игр. Подмножество таких игр – повторяющиеся игры, – как выяснилось, особенно хорошо поддается формальному анализу и полезно для институционального анализа (глава VI).
Теория повторяющихся игр изучает ситуации, в которых одна и та же (динамическая или статическая) игра (например, «Дилемма заключенного» или «Односторонняя дилемма заключенного») повторяется во время каждого периода. В конце каждого периода выигрыши распределяются, может открыться новая информация, и та же самая стадия игры повторяется снова. Будущие выигрыши дисконтируются (коэффициент дисконтирования часто обозначается как б). История в повторяющейся игре – это множество действий, совершенных в прошлом; стратегия определяет комбинацию действий на каждой стадии игры в соответствии с любой возможной историей. Комбинация стратегий определяет стратегию для каждого игрока[396].
Для изучения самоподдерживающегося поведения в таких играх предположим, что повторяющаяся базовая игра – это «Дилемма заключенного», представленная на рис. А.1. Если эта базовая игра повторяется только один раз, то единственное совершенное по подыгре равновесие – это (предательство, предательство); (сотрудничество, сотрудничество) не образует равновесия. Сравнимое совершенное по подыгре равновесие в повторяющейся игре заключается в том, что после каждой истории оба игрока всегда предают. Такое равновесие также является единственным равновесием, если игра повторяется конечное число раз. Причины этого и предполагаемые важные следствия для институционального анализа обсуждаются в Приложении В, раздел В.2.1. Здесь же мы рассматриваем ситуации, в которых стадийная игра повторяется бесконечное число периодов.
Когда базовая игра повторяется бесконечно, предшествующая стратегия по-прежнему является совершенным по подыгре равновесием. Наилучший ответ каждого игрока на эту стратегию – всегда предавать. Но возможны и другие равновесия[397]. Рассмотрим, например, следующую стратегию для каждого игрока. В первом периоде – сотрудничать. Затем сотрудничать, только если всеми ходами во всех прежних периодах были (сотрудничество, сотрудничество); в противном случае – предавать. Стратегия каждого игрока, таким образом, требует инициирующего обмена в первом периоде и сотрудничества до тех пор, пока другой сотрудничает. Она не требует сотрудничества, если любой из игроков когда-либо уклонялся от него. Такая угроза навсегда прекратить сотрудничество является достоверной, потому что (предательство, предательство) – это равновесие.
Достоверная угроза такой стратегии-триггера может мотивировать игроков к сотрудничеству, если они достаточно терпеливы. Стратегия подразумевает, что игроку нужно выбирать между настоящими и будущими выигрышами. Предательство подразумевает относительно большой мгновенный выигрыш (5 очков в игре, представленной на рис. А.1), потому что второй игрок сотрудничает. Но это действие подразумевает потерю будущих выигрышей от сотрудничества, потому что вслед за предательством оба игрока всегда будут предавать (и, следовательно, каждый будет получать -8). Чистая приведенная стоимость следования стратегии-триггеру составляет 1/(1 – б). Отступление от нее предполагает получение одноразового выигрыша в 5 очков, за которым последует получение -8 в каждом последующем периоде. Это дает чистую дисконтиованную ценность 5 – б /(1 – б), которая снижается по мере роста коэффициентов дисконтирования у игроков: если игроки в достаточной мере терпеливы (если они достаточно высоко ценят будущую выгоду), предшествующая стратегия является равновесием.
Одна из самых полезных особенностей повторяющейся теории игр заключается в следующем: установить, что определенная комбинация стратегий является совершенным по подыгре равновесием, зачастую бывает проще, чем установить, что стратегия является равновесием Нэша. Грубо говоря, в любой повторяющейся игре комбинация стратегий – совершенное по подыгре равновесие, если ни одному из игроков невыгодно однократное отступление после любой истории. Другими словами, чтобы проверить, является ли определенная комбинация стратегий совершенным по подыгре равновесием, достаточно установить, что после любой истории – любой последовательности действий, которая может возникнуть при этой стратегии, – ни один игрок не может выиграть от однократного отклонения, после которого он вернется к следованию той же самой стратегии[398].
В стратегических динамических ситуациях часто существует множественное равновесие. «Народная» теорема о повторяющихся играх гласит, что в бесконечно повторяющихся играх обычно есть бесконечное число совершенных по подыграм равновесий[399]. При данных правилах игры может существовать более одной формы поведения в качестве исхода равновесия, а в динамических играх с большим множеством действий это еще более вероятно.
Открывая существование множественных равновесий, теория игр поднимает проблему выбора равновесия. В литературе по теории игр предлагались усовершенствования концепции равновесия Нэша, дедуктивно ограничивающие множество допустимых исходов. Совершенное по подыгре является одним из таких ограничений. Но до сих пор теория игр не смогла предложить подходящее дедуктивное усовершенствование для бесконечно повторяющихся игр, ведущее к единственному равновесию [Van Damme, 1983, 1987; Fudenberg, Tirole, 1991].
- Модель Нового американского университета - Уильям Дэбарс - Образовательная литература
- Социальное общение и демократия. Ассоциации и гражданское общество в транснациональной перспективе, 1750-1914 - Штефан-Людвиг Хоффманн - Образовательная литература
- Управляй гормонами счастья. Как избавиться от негативных эмоций за шесть недель - Лоретта Бройнинг - Образовательная литература
- Теория получаса. Как выучить английский за 30 минут в день - Элизабет Майклз - Образовательная литература
- Структура современной лирики. От Бодлера до середины двадцатого столетия - Гуго Фридрих - Образовательная литература
- Знать или уметь? 6 ключевых навыков современного ребенка - Кэти Хирш-Пасек - Образовательная литература
- Уголовный кодекс Федеративной Республики Германии - Дмитрий Шестаков - Образовательная литература
- Самый счастливый малыш на детской площадке: Как воспитывать ребенка от года до четырех лет дружелюбным, терпеливым и послушным - Пола Спенсер - Образовательная литература
- Избранное: Динамика культуры - Бронислав Малиновский - Образовательная литература
- Технологии Четвертой промышленной революции - Николас Дэвис - Образовательная литература