Теория игр. Искусство стратегического мышления в бизнесе и жизни
Шрифт:
Цель кампании по продвижению продукции посредством выпуска купонов на скидку состоит в том, чтобы увеличить долю компании на рынке. Однако в каждой компании осознают: для того чтобы получить требуемый результат, необходимо предлагать купоны на скидку только тогда, когда конкурент не делает этого. Стратегия случайного выбора недель для распространения купонов может быть рассчитана на то, чтобы застать другую компанию врасплох. Но если обе компании применяют аналогичные стратегии, на протяжении многих недель они будут предлагать купоны одновременно. В эти недели их мероприятия по продвижению продукции просто сведут друг друга на нет: ни одна из компаний не увеличит свою долю на рынке и они обе получат более низкую прибыль. В итоге применение таких стратегий создает дилемму заключенных. В компаниях, постоянно поддерживающих взаимодействие друг с другом, понимают, что они обе могут добиться большего, решив эту дилемму. Один из способов сделать это – предлагать свои
Существуют и другие ситуации, в которых компании должны избегать шаблонов и предсказуемости действий. Некоторые авиакомпании предлагают билеты со скидками тем путешественникам, которые готовы приобрести билеты в последнюю минуту. Однако не сообщают, сколько свободных мест осталось, для того чтобы можно было оценить шансы на успешную покупку билета. Если бы наличие билета, который можно купить в последнюю минуту, являлось более предсказуемым, тогда возникло бы гораздо больше возможностей для эксплуатации этой системы и авиакомпании потеряли бы больше своих клиентов из числа тех, кто в большинстве случаев покупают билеты обычным способом.
В бизнесе рандомизированные стратегии чаще всего применяются для мотивации соблюдения установленных правил при одновременном снижении затрат на мониторинг. Это касается самых разных ситуаций – от налоговых проверок и тестов на наркотики до парковочных счетчиков. Кроме того, это объясняет, почему наказание не всегда должно соответствовать преступлению.
Как правило, штраф за нарушение правил парковки во много раз превышает плату за парковку. Если стоимость парковки по счетчику составляет 1 доллар в час, достаточно ли штрафа в размере 1,01 доллара для того, чтобы люди придерживались правил? Достаточно, но только при условии, что дорожная полиция обязательно поймает вас каждый раз, когда вы не заплатите за парковку. Такая система контроля за соблюдением правил обходилась бы очень дорого. Заработная плата инспекторов дорожного движения стала бы самой большой статьей расходов, но затраты на систему взыскания штрафов, необходимую для обеспечения эффективности такой политики, тоже были бы достаточно большими.
Вместо этого органы власти используют столь же эффективную, но менее затратную стратегию: ввести более крупные штрафы и ослабить контроль за соблюдением правил парковки. Если штраф составляет 25 долларов, риска быть пойманным с вероятностью 1/25 вполне достаточно, чтобы заставить вас соблюдать правила. В такой системе задействовано гораздо меньше полицейских, а собранных штрафов достаточно, чтобы покрыть административные расходы.
Это еще один пример практической ценности смешанных стратегий. В чем-то он похож на пример из области футбола, а в чем-то отличается от него. Стоит подчеркнуть еще раз: органы власти выбирают рандомизированную стратегию потому, что она лучше любых системных действий – полное отсутствие контроля за соблюдением правил привело бы к неправильному использованию мест для стоянки автомобилей, которых всегда не хватает, а стопроцентный контроль обходился бы слишком дорого. Для того чтобы наладить эффективную работу автостоянок, органам власти необходимо обеспечить и достаточно строгий контроль, и достаточно высокие штрафы.
Принципы выборочного тестирования на предмет употребления наркотиков аналогичны системе контроля за соблюдением правил парковки. Ежедневная проверка всех сотрудников на наркотики потребовала бы слишком больших затрат времени и денег. Выборочное тестирование позволяет обнаружить тех сотрудников, которые не способны работать без приема наркотиков, и отбивает у остальных желание употреблять наркотики в свободное от работы время. В этом случае вероятность обнаружения тоже достаточно низкая, но наказание очень строгое. То же наблюдается в стратегии проверок Налогового управления США: штрафы слишком маленькие, учитывая вероятность быть пойманным за нарушение налогового законодательства. Когда контроль за соблюдением правил носит выборочный характер, наказание должно быть тяжелее преступления. Необходимо придерживаться такого правила: ожидаемое (в статистическом смысле) наказание должно соответствовать преступлению с учетом вероятности быть пойманным.
Люди, которые стремятся обойти систему контроля за соблюдением правил, используют стратегию выборочного контроля с выгодой для себя. Они могут замаскировать истинное нарушение множеством фальшивых сигналов тревоги и обманных маневров, из-за чего ресурсы контролирующих органов становятся слишком разбросанными, а значит, неэффективными. Например, система противовоздушной обороны должна быть способной уничтожить все без исключения атакующие ракеты. Для атакующей стороны самый эффективный с точки зрения затрат способ преодолеть систему противовоздушной обороны сводится к тому, чтобы окружить настоящую ракету группой фальшивых. Создать фальшивую ракету гораздо дешевле, чем настоящую. До тех пор пока обороняющаяся сторона не распознает их совершенно
Запуск невзрывающихся артиллерийских снарядов начали практиковать еще в период Второй мировой войны, причем не по причине умышленного выпуска таких снарядов, а в качестве решения проблем с контролем качества. «Отбор бракованных снарядов в процессе их производства требует больших затрат. У кого-то появилась идея выпускать невзрывающиеся снаряды и время от времени стрелять ими. Командиры военных подразделений не могли допустить, чтобы на их позициях лежали такие бомбы замедленного действия, поскольку им не дано было знать, какой снаряд настоящий, а какой бракованный. Такой блеф заставлял их потрудиться над каждым невзорвавшимся снарядом, упавшим в расположении их подразделений» [72] .
72
John McDonald, Strategy in Poker, Business, and War (New York: W. W. Norton, 1950), 126.
Когда затраты на оборону пропорциональны числу ракет, которые должны быть сбиты, атакующая сторона может сделать эти затраты непомерно высокими. Это одна из самых сложных проблем создания системы противоракетной обороны, которая, возможно, вообще не имеет решения.
Поиск равновесия в смешанных стратегиях
Многим читателям вполне достаточно понять суть смешанных стратегий на качественном концептуальном уровне и затем возложить задачу вычисления фактических показателей на компьютерную программу, способную рассчитать смешанные стратегии, когда у каждого игрока есть любое число чистых стратегий (при этом некоторые из них могут даже не использоваться в равновесии) [73] . Эти читатели могут пропустить оставшуюся часть главы без ущерба для понимания изложенного материала. Но тем читателям, которые знают алгебру и геометрию хотя бы на уровне курса средней школы, мы предлагаем более подробную информацию по этой теме [74] .
73
Существует много программ подобного типа, в том числе Gambit и ComLabGames. Вторая программа позволяет экспериментировать с играми и их результатами в интернете; ее можно скачать здесь: www.comlabgames.com.
74
Более подробную информацию можно найти здесь: Dixit and Skeath, Games of Strategy, Сhapter 7. Поистине глубокий анализ этой темы содержится в главе 4 и приложениях 2–6 книги R. Duncan Luce and Howard Raiffa, Games and Decisions (New York: Wiley, 1957).
Сначала рассмотрим алгебраический метод. Число стратегий «слева» в смешанной стратегии игрока, выполняющего пенальти, – это неизвестное, которое нужно найти; назовем его х. Поскольку это относительная доля, число стратегий «справа» составит (1 – х). Показатель эффективности такой смешанной стратегии в случае, если вратарь выберет стратегию «слева», составит 58x + 93(1 – x) = 93–35x процентов, а если он выберет стратегию «справа» – 95x + 70(1 – x) = 70 + 25x процентов. Эти два показателя будут равными, если 93–35x = 70 + 25x, или 23 = 60x, или x = 23/60 0,383.
Мы можем также найти решение графическим методом, отобразив результаты различных вариантов смешивания стратегий на графике. Доля ударов слева в смешанной стратегии бьющего игрока, которую мы обозначили как х, отображается на горизонтальной оси от 0 до 1. По каждому варианту смешивания стратегий одна из двух линий отображает показатель эффективности стратегии бьющего игрока в случае, если вратарь выберет чистую стратегию «слева» (обозначенную на графике буквой Л), а другая – показатель эффективности стратегии бьющего игрока, если он выберет чистую стратегию «справа» (буква П). Первая линия начинается в точке, соответствующей значению 93 (значение выражения 93–35x при х = 0), и опускается до значения 58 (значение этого же выражения при х = 1). Вторая линия начинается в точке, соответствующей значению 70 (значение выражения 70 + 25x при х = 0), и повышается до значения 95 (значение этого же выражения при х = 1).