Теория игр. Искусство стратегического мышления в бизнесе и жизни, Диксит Авинаш

Теория игр. Искусство стратегического мышления в бизнесе и жизни

на обложку

Диксит Авинаш

Шрифт:

Метод вознаграждения проблематичен по нескольким причинам. Вознаграждение может носить внутренний характер: один игрок платит другому за выбор стратегии сотрудничества. В иных случаях вознаграждение может быть внешним: третья сторона, заинтересованная в сотрудничестве между двумя игроками, платит им за выбор этой стратегии. Как бы там ни было, вознаграждение нельзя предоставлять игроку, пока он не сделает свой выбор, в противном случае он просто положит его себе в карман, после чего откажется выполнять договоренность. С другой стороны, если вознаграждение просто обещают, игрок может не поверить этому обещанию: когда он выберет стратегию сотрудничества, не исключено, что тот, кто дал это обещание, нарушит его.

Однако, несмотря на все эти трудности, вознаграждение бывает действенным и полезным. Проявив максимум креативности и воображения, игроки могли бы одновременно дать друг другу обещания и сделать их заслуживающими доверия, поместив обещанное вознаграждение на счете условного депонирования, который контролирует третья сторона [31] . В

реальной жизни чаще складывается иная ситуация: поскольку игроки взаимодействуют по нескольким направлениям, сотрудничество в одном из них вознаграждается ответной услугой в чем-то другом. Так, самки шимпанзе делятся едой или присматривают за чужими детенышами в обмен на помощь в уходе за шерстью. В некоторых случаях третья сторона может быть заинтересована в обеспечении сотрудничества в игре. Например, ради того чтобы положить конец конфликтам в разных странах мира, Соединенные Штаты Америки и Европейский союз иногда обещают участникам противостояния экономическую помощь в качестве вознаграждения за мирное решение конфликта. Именно таким способом Соединенные Штаты вознаградили Израиль и Египет за сотрудничество в рамках подписания Кэмп-Дэвидских мирных соглашений в 1978 году.

На основании этой идеи Джеймс Андреони и Хэл Вэриан разработали экспериментальную игру под названием Zenda. См. Preplay Communication in the Prisoners’ Dilemma, Proceedings of the National Academy of Sciences 96, no. 19 (September 14, 1999): 10933–10938. Мы проводили эту игру на занятиях и пришли к выводу, что она обеспечивает сотрудничество между игроками. Однако в реальных условиях достичь этого гораздо труднее.

Более распространенный метод решения дилеммы заключенных – наказание. Он имеет прямое действие. В фильме «Секреты Лос-Анджелеса» сержант Эд Эксли обещает Лерою Фонтейну, одному из подозреваемых, что если он согласится стать государственным свидетелем, то получит более мягкий приговор, чем два других подозреваемых, Рэй Коутс и Тайрон Джонс. Но Лерой знает, что, когда он выйдет из тюрьмы, его могут ждать на свободе друзья этих двоих!

Наказание, которое в данном контексте выглядит более естественным, оказывается возможным в связи с тем, что большинство подобных игр представляют собой часть непрерывного взаимодействия. Обман может обеспечить одному игроку краткосрочное преимущество, но навредит его взаимоотношениям с другим игроком и в долгосрочной перспективе обойдется гораздо дороже. Если цена достаточно велика, именно это может удержать игрока от обмана {50} .

В 2005 году Роберт Ауман получил Нобелевскую премию по экономике за выдающийся вклад в разработку общей теории кооперации в повторяющихся играх.

Наглядный пример такой ситуации предоставляет бейсбол. В Американской бейсбольной лиге питчеры попадают мячом в бэттеров на 11–17 процентов чаще, чем в Национальной бейсбольной лиге. По мнению профессоров Университета Юга в Суони Дага Драйнена и Джона-Чарльза Брэдбери, это обусловлено правилом о назначенном хиттере [32] . В Американской бейсбольной лиге питчеры не бьющие игроки. Следовательно, питчер Американской лиги, который попадает мячом в бэттера, может не бояться ответных действий со стороны питчера команды-соперника. Вероятность того, что мяч попадет в питчера, совсем небольшая, но она повышается в четыре раза, если он попал в кого-то в предыдущей половине иннинга. В таком случае страх получить ответный удар очевиден. Первоклассный питчер Курт Шиллинг объяснил это так: «Вы на самом деле готовы бросить в кого-то мяч, если играете против Рэнди Джонсона?» {51} [33] .

Об этом идет речь в их рабочем докладе Identifying Moral Hazard: A Natural Experiment in Major League Baseball, доступ к которому можно получить здесь: http://ddrinen.sewanee.edu/Plunk/dhpaper.pdf.

Рэндалл Дэвид Рэнди Джонсон – американский профессиональный бейсболист. Скорость его подач часто превышала 160 км/ч. – Прим. ред.

В то время Шиллинг был питчером команды Arizona Diamondbacks Национальной бейсбольной лиги, а обладатель приза Сая Янга Рэнди Джонсон – его товарищем по команде. Источник: Ken Rosenthal, “Mets Get Shot with Mighty Clemens at the Bat,” Sporting News, June 13, 2002.

В ситуации, когда один игрок наказывает другого за обман, действует стратегия «око за око, зуб за зуб». Эта стратегия оказалась настоящим открытием, сделанным в ходе самого известного эксперимента с дилеммой заключенных. В следующем разделе вы узнаете об этом эксперименте и его уроках.

Стратегия равноценных ответных действий

В начале 1980-х годов политолог Мичиганского университета Роберт Аксельрод предложил специалистам по теории игр со всего мира разработать стратегии решения дилеммы заключенных в виде компьютерных программ. Они были распределены по парам, каждая из которых разыгрывала дилемму заключенных 150 раз. На

основании набранных очков составили рейтинг программ, принимавших участие в турнире.

Победителем стал профессор математики университета в Торонто Анатолий Рапопорт. Его выигрышная стратегия оказалась одной из самых простых: «око за око, зуб за зуб». Для Роберта Аксельрода этот результат явился большой неожиданностью, поэтому он решил провести еще один турнир, увеличив число участников. Рапопорт и в этот раз подал программу, основанную на той же стратегии, – и снова победил.

Стратегия равноценных ответных действий – один из вариантов правила поведения «поступайте с другими так, как они поступают с вами» {52} . Если говорить более точно, эта стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия, которые предпринял соперник на предыдущем этапе.

В книге «Исход» (21:22–25) сказано: «Когда дерутся люди, и ударят беременную женщину, и она выкинет, но не будет [другого] вреда, то взять с [виновного] пеню, какую наложит на него муж той женщины, и он должен заплатить оную при посредниках; а если будет вред, то отдай душу за душу, глаз за глаз, зуб за зуб, руку за руку, ногу за ногу, обожжение за обожжение, рану за рану, ушиб за ушиб». Новый Завет проповедует поведение, основанное на принципах сотрудничества. В Евангелии от Матфея (5:38–39) сказано: «Вы слышали, что сказано: око за око и зуб за зуб. А Я говорю вам: не противься злому. Но кто ударит тебя в правую щеку твою, обрати к нему и другую». Таким образом, мы перешли от правила «Поступайте с другими так, как они поступают с вами» к золотому правилу: «И как хотите, чтобы с вами поступали люди, так и вы поступайте с ними» (Евангелие от Луки 6:31). Если бы люди всегда придерживались золотого правила, дилеммы заключенных просто не существовало бы. Если мыслить более широко, становится очевидным следующий вывод: хотя сотрудничество может снизить ваш выигрыш в той или иной игре, возможное вознаграждение в жизни после смерти может сделать эту стратегию целесообразной даже для эгоиста. Вы считаете, что загробной жизни нет? Пари Блеза Паскаля гласит: если действовать, опираясь на это предположение, последствия могут оказаться катастрофическими, поэтому лучше выбрать другой вариант.

По мнению Роберта Аксельрода, стратегия равноценных ответных действий опирается на четыре принципа, которые должны присутствовать в любой эффективной стратегии для повторяющейся дилеммы заключенных: понятность, доброжелательность, возмездие и прощение. Стратегия равноценных ответных действий очень проста и понятна: сопернику нет необходимости долго размышлять над вашим следующим ходом или просчитывать его. В основе такой стратегии лежит доброжелательность: она никогда не инициирует обман. В этой стратегии есть элемент возмездия: она не оставляет обман безнаказанным. Кроме того, эта стратегия стимулирует прощение: участники игры не держат зла друг на друга слишком долго и готовы возобновить сотрудничество.

Одна из самых впечатляющих характеристик стратегии равноценных ответных действий состоит в том, что она показала лучшие результаты по итогам всего турнира, хотя и не победила (и не могла победить) ни одну из конкурирующих стратегий в прямом противостоянии с ними. В лучшем случае эта стратегия может только сравнять счет с соперником. Следовательно, если бы Аксельрод оценивал каждую игру по принципу «победитель получает все», стратегия равноценных ответных действий имела бы на своем счету только проигрыши и ничьи, а значит, не добилась бы победы по итогам всего турнира {53} .

Поскольку на каждого проигравшего приходится один победитель, это неизбежно приводит к тому, что у одного из участников соревнования окажется в итоге больше побед, чем поражений, а у других – больше поражений, чем побед. (Единственное исключение составляет ситуация, когда каждый поединок заканчивается вничью.)

Однако Аксельрод оценивал парные игры между компьютерными программами не по принципу «победитель получает все»: в его турнирах учитывался такой фактор, как готовность к сотрудничеству. Большое преимущество этой стратегии заключается в том, что она сближает соперников. В худшем случае эта стратегия может потерпеть поражение из-за одного предательства, но дальше – только ничья.

Стратегия равноценных ответных действий стала победителем этих соревнований именно потому, что стимулировала сотрудничество, не допуская при этом эксплуатации. Другие стратегии были либо слишком ориентированными на доверие и открытыми для эксплуатации, либо слишком агрессивными и побуждающими игроков выбивать друг друга из игры.

И все-таки мы считаем, что стратегия равноценных ответных действий – ошибочная. Малейший промах или неправильное толкование результатов приводят к полному провалу стратегии. Этот недостаток не был столь очевидным в искусственной среде соревнования между компьютерными программами, поскольку там просто исключались ошибки и неправильное толкование. Однако в случае применения этой стратегии в реальном мире ошибки и заблуждения неизбежны, а результат может оказаться катастрофическим.

Проблема стратегии равноценных ответных действий состоит в том, что обе стороны противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание ответным ударом, который влечет за собой очередное наказание. В таком противостоянии может и не наступить момент, когда одна из сторон приняла бы наказание без ответного удара.

Ты предал нашу семью

Рей Полина

2. Предатели

Любовные романы:

современные любовные романы

5.00

рейтинг книги

Авиатор: назад в СССР 11

Дорин Михаил

11. Покоряя небо

Фантастика:

альтернативная история

5.00

рейтинг книги

Любовные романы:

любовно-фантастические романы

7.07

рейтинг книги

Чтение онлайн

книги

авторы

Жанры

Деловая литература

Детективы

Детские

Документальная литература

Дом и Семья

Драматургия

Жанр не определен

Компьютеры и Интернет

Любовные романы

Научно-образовательная

Поэзия

Приключения

Проза

Прочее

Религия и эзотерика

Справочная литература

Старинная литература

Техника

Фантастика

Фольклор

Юмор

Теория игр. Искусство стратегического мышления в бизнесе и жизни

Диксит Авинаш

Шрифт:

Совок 5

5. Совок

Фантастика:

детективная фантастика

попаданцы

альтернативная история

рейтинг книги

Тринадцатый II

2. Видящий смерть

Фантастика:

фэнтези

попаданцы

аниме

рейтинг книги

Крестоносец

7. Помещик

Фантастика:

героическая фантастика

попаданцы

альтернативная история

рейтинг книги

Идеальный мир для Лекаря 14

14. Лекарь

Фантастика:

юмористическое фэнтези

попаданцы

аниме

рейтинг книги

Кодекс Крови. Книга V

5. РОС: Кодекс Крови

Фантастика:

фэнтези

попаданцы

аниме

рейтинг книги

Ты предал нашу семью

2. Предатели

Любовные романы:

современные любовные романы

рейтинг книги

Авиатор: назад в СССР 11

11. Покоряя небо

Фантастика:

альтернативная история

рейтинг книги

Менталист. Революция

3. Выиграть у времени

Фантастика:

боевая фантастика

рейтинг книги

Лорд Системы

1. Лорд Системы