Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Дилемма заключенного и доминантные стратегии. Теория игр - Хорди Деулофеу на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:

Рост компании

Некая компания занимается разработкой нового продукта и оценивает возможность его выхода на рынок в следующем году. Можно выпустить продукт ограниченной серией из-за опасений, что экономическая обстановка будет неудовлетворительной, либо выпустить продукт крупной серией в надежде на экономический рост. Ожидаемая прибыль (в тысячах евро) приведена в таблице:

Руководство компании считает, что экономическая обстановка определяется некоей смешанной стратегией. Какова оптимальная смешанная стратегия компании и ожидаемая прибыль?

Элементы матрицы позволяют увидеть, что не существует оптимальной чистой стратегии, так как седловая точка отсутствует (максиминное значение равно 300, минимаксное равно 500). Следовательно, нужно определить оптимальную смешанную стратегию.

Обозначим за р вероятность выпуска крупной серии, (1 — р) — малой серии, V — ожидаемый доход. При плохой экономической обстановке доход будет равняться

V = 500 (1 — р) + ЮОр, что равносильно V = 500 - 400р.

При хорошей экономической обстановке доход будет равняться

V = 300 (1 — р) + 900р, то есть V = 300 + 600р.

Решением этой системы уравнений является р = l/5, V = 420. Это означает, что если бы ситуация могла повториться несколько раз, то оптимальным вариантом было бы выпускать продукт крупной серией 1 раз из 5 случайным образом и 4 раза из 5 — малой серией, при этом средний ожидаемый доход составит 420 тысяч евро.

Средний доход можно было вычислить напрямую с помощью формулы V = (ad - bc) / (а + d - b - с), где a, b, с, d — элементы платежной матрицы (слева направо и сверху вниз). Для данной задачи получим (500 • 900 - 300 • 100)/(500 + 900 - 300 - 100) = 420000/1000 = 420, что очевидно совпадает с результатом, полученным выше из системы линейных уравнений.

С другой стороны, мы действовали так, как если бы экономическая обстановка определялась некоей смешанной стратегией. Аналогичные расчеты показывают, что вероятность хорошей экономической обстановки равна 2/5, следовательно, вероятность плохой экономической обстановки равна 3/5.

Серия пенальти

Пенальти в футболе можно рассматривать как антагонистическую игру между пенальтистом и вратарем, где интересы участников прямо противоположны. Допустим, что пенальтист может пробить вправо, влево или по центру (это три чистые стратегии), а вратарь может прыгнуть в правый или левый от себя угол или же остаться в центре ворот (это также три чистые стратегии). На основании статистики была сформирована следующая таблица:

Элементы матрицы означают вероятность гола (то есть выигрыш бьющего) в зависимости от стратегии, выбранной обоими игроками. Например, если пенальтист бьет вправо, а вратарь прыгает в правый от себя угол, вероятность гола равна 0,9. Если же удар придется по центру и вратарь останется стоять в центре, то вероятность гола будет равной всего 0,1. Какой стратегии должны придерживаться бьющий и вратарь?

КОРПОРАЦИЯ RAND

Корпорация RAND (от англ. Research and Development — «Исследования и разработка») — американский исследовательский центр, созданный после Второй мировой войны с целью проведения стратегических исследований для военно-воздушных сил США. Многие проекты корпорации были засекречены и не доведены до логического завершения, но нет никаких сомнений, что в RAND работали одни из лучших ученых в области теории игр. В 1948 году Центр получил статус частной организации, работающей исключительно на военно-воздушные силы, которые полностью его финансировали. Именно в этой корпорации были проведены фундаментальные исследования, которые способствовали развитию теории игр.

Внутренняя организация Центра больше напоминала научно-исследовательский институт, чем военное учреждение. В 50-е и 60-е годы прошлого века помимо прикладных исследований, связанных с ядерным оружием и началом холодной войны, в корпорации также проводились фундаментальные исследования силами выдающихся математиков и экономистов. Среди них все тот же Джон фон Нейман, Джон Нэш, Меррил Флад, Кеннет Эрроу и многие другие ученые, расцвет деятельности которых пришелся на этот короткий промежуток времени, совпавший с началом бурного роста теории игр.

Новая штаб-квартира корпорации RAND в Санта-Монике, Калифорния.

Первоначальный анализ показывает, что не существует доминантной чистой стратегии и что задача не имеет решения в чистых стратегиях, так как максиминное значение равно 0,6, а минимаксное — 0,8. Иными словами, пенальтист ожидает забить 6 из 10 пенальти, а вратарь ожидает, что пропустит гол в 8 из 10 случаев. Оба хотят (и могут) улучшить свой результат (т. е. выигрыш): пенальтист хочет, чтобы вероятность забить была выше 0,6, а вратарь хочет, чтобы вероятность пропустить была ниже 0,8.

Рассчитаем оптимальную смешанную стратегию для бьющего и для вратаря, а также среднюю цену игры, которая будет означать среднюю вероятность того, что с пенальти будет забит гол. В этом случае средняя цена игры будет лежать в интервале от 0,6 до 0,8.

Чтобы определить оптимальную смешанную стратегию для бьющего, нужно рассчитать вероятности выбора каждой из трех чистых стратегий. Обозначим их p(правый угол), p(левый угол), p(центр). Так как p(правый угол) + p(левый угол) + p(центр) = 1, число переменных можно сократить до двух: p(правый угол), p(центр), 1 - p(правый угол) - p(центр). Ожидаемую цену игры обозначим за V.

Если вратарь прыгнет в правый от себя угол, то ожидаемый выигрыш пенальтиста составит

V = 0,9 p(правый угол) + 0,8 p(центр) + 0,5 (1 - p(правый угол) - p(центр)).

Если вратарь останется в центре, то

V = 0,9 p(правый угол) + 0,1 p(центр) + 0,8 (1 - p(правый угол) - p(центр)).

Если же вратарь прыгнет в левый от себя угол, то

V = 0,6 p(правый угол) + 0,7 p(центр) + 0,8 (1 - p(правый угол) - p(центр)).

Мы получили систему из трех линейных уравнений. Ее решением будет являться p(правый угол) = 0,37; p(центр) = 0,19; p(левый угол) = 1 - p(правый угол) - p(центр) = 0,44. Цена игры для бьющего равна V = 0,71.

Аналогично можно рассчитать вероятности для каждой из трех чистых стратегий вратаря, но эту задачу мы оставляем читателю.

Преимущества и ограничения метода минимакса

Несомненно, теорема о минимаксе и метод, показанный в прошлых разделах, как для чистых, так и для смешанных стратегий, — это мощные инструменты для решения матричных игр и определения оптимальных результатов. Эта теорема применяется в экономике, политике, спорте и военном деле. С ее помощью были решены не только задачи, в которых имеются доминантные стратегии или седловая точка, но также задачи без седловой точки, в которых можно определить среднюю цену игры, оптимальную для обеих сторон, и необходимые смешанные стратегии.

Несмотря на это, во всех случаях мы предполагали, что выполняется одно условие: игроки действуют «разумно». Иными словами, каждый игрок считает, что его соперник всегда действует в своих интересах и использует стратегию, оптимальную с этой точки зрения. Но что происходит, если это не так и если один из игроков пытается обмануть оппонента?

Мортон Дэвис во введении в теорию игр рассказывает о различных исследованиях, которые проводились в 1950—1970-е годы. Целью исследований было наблюдение за поведением реальных игроков в матричных играх. Так, в 1964 году Ричард Брейер придумал игру, разрешимую в чистых стратегиях, то есть в этой игре было легко найти точку равновесия. Игрокам говорили, что против них в одних случаях будет играть опытный игрок, в других — игрок, который будет действовать случайным образом. В действительности игроки всегда играли против экспериментатора, который менял стратегию: иногда он следовал оптимальной стратегии Б, иногда действовал случайным образом. Платежная матрица этой игры выглядела так:

Игру можно быстро решить с помощью теоремы о минимаксе. Точка равновесия — элемент матрицы (б, Б), равновесное значение равно 1. Следовательно, игрок всегда должен выбирать стратегию б, экспериментатор — стратегию Б, и в каждой партии выигрыш игрока будет равен 1.

Опыты показали, что игроки применяли стратегию б, когда видели, что экспериментатор всегда придерживается стратегии Б. Напротив, когда экспериментатор действовал случайным образом, они меняли стратегию и обычно применяли вариант а, чтобы получить максимальный выигрыш, осознавая при этом возможность проигрыша. Последующие опросы показали, что более половины игроков считали, что систематическое следование стратегии Б со стороны экспериментатора «глупо», так как он соглашался с проигрышем в 1. Если бы он применял другие стратегии, то, «возможно», мог бы улучшить свой результат. Игроки не обратили внимания, что если бы они следовали стратегии б, то экспериментатору был бы гарантирован проигрыш минимум в 1.

Этот и другие похожие эксперименты показали, что разумные действия, направленные на увеличение выигрыша, встречаются не всегда. Люди предпочитают стратегии, которые, как кажется, приносят больший выигрыш. Лишь после того, как они несколько раз убедятся в обратном, они приходят к оптимальной стратегии. Если же в игре нет седловой точки и нужно применять смешанные стратегии, то реальное поведение игроков еще сложнее. В этом случае игрокам был известен алгоритм решения, но, несмотря на это, больше половины не стали утруждать себя вычислениями и действовали интуитивно. Как правило, их действия отличались от оптимальной смешанной стратегии.

Все подобные эксперименты показывают, что в реальных ситуациях нужно ставить под сомнение «разумные» предположения о том, что, например, соперник будет действовать оптимальным образом и в соответствии со своими интересами. Возможно, объяснение кроется в том, что минимаксная стратегия является защитной: она гарантирует результат, который будет оптимальным, когда соперник будет действовать разумно. Однако почему игрок не будет стараться получить больше гарантированного минимума?

В этой главе мы проанализировали игры с нулевой суммой и пришли к выводу: в играх такого типа существует оптимальная стратегия для каждого игрока, а также цена игры, которая позволяет определить средний выигрыш каждого. Исходные данные подобных игр всегда можно представить в виде так называемой платежной матрицы. В ней строки соответствуют стратегиям первого игрока, столбцы — стратегиям второго игрока. Вкратце игры для двух игроков с нулевой суммой решаются следующим способом.

Нужно вычислить максиминное значение (максимальное из минимальных) для первого игрока и минимаксное (минимальное из максимальных) для второго. Если эти значения совпадают, то оптимальные стратегии для обоих игроков имеют одинаковый результат (он называется ценой игры), и игра решена. В этом случае стратегии называются чистыми.

Если же максиминное и минимаксное значения не совпадают, нужно отложить в сторону чистые стратегии (с помощью которых определялись минимаксное и максиминное значения) и рассмотреть все чистые стратегии для каждого игрока, присвоив каждой стратегии определенную вероятность. Эти вероятности (их сумма будет равна 1) определят оптимальную смешанную стратегию и позволят рассчитать среднюю цену игры для каждого игрока.

Определение вероятностей и средней цены для каждого игрока осуществляется решением системы линейных уравнений (число уравнений зависит от количества стратегий), где неизвестными являются искомые вероятности и средняя цена игры. Если средняя цена для обоих игроков совпадает, то игра решена, и вероятности, найденные для каждого игрока, определяют его оптимальную стратегию, которая будет смешанной (так как в ней будет присутствовать элемент случайности).

Если найденные средние цены игры отличаются либо если одна из вероятностей оказалась отрицательной, то игра не решена. В этом случае ее нужно проанализировать снова, чтобы определить, возможно ли найти какую-либо доминантную стратегию. Если это невозможно, то описанный нами метод неприменим.

Глава 5. Что наша жизнь? — Игра! Применения теории в реальном мире

Конкуренция лежит в основе науки... и всей жизни. <...> Соперничество и сотрудничество делают нас такими, какие мы есть.

Эрвин Неер, лауреат Нобелевской премии по медицине

Во всех задачах, представленных в прошлой главе, речь шла о соперничестве: выигрыш одного игрока всегда равнялся проигрышу другого, поэтому подобные игры называются играми с нулевой суммой. Это конфликтные ситуации, участники которых имеют прямо противоположные цели. Каждый игрок стремится получить максимальный выигрыш, что будет означать максимальный проигрыш соперника.

В этой главе мы рассмотрим немного другую тему. Целью игроков по-прежнему будет выигрыш, все так же будет существовать конфликтная ситуация, но это еще не все. С одной стороны, выигрыш одного не обязательно будет соответствовать проигрышу другого, и будут существовать стратегии, в которых выиграть могут оба игрока. С другой стороны, будут существовать ситуации, в которых сотрудничество будет выгодным для обеих сторон. Таким образом, в играх возникают коммуникация и взаимное доверие, но также и угрозы, цель которых — заставить соперника выполнить обещанное. В этих случаях речь идет о не полностью конфликтных ситуациях, и мы будем различать кооперативные и некооперативные стратегии.

Вспомним, что теория игр изучает принятие решений. В настоящей главе этому аспекту уделено особое внимание, так как во многих ситуациях, о которых мы расскажем далее, будет присутствовать выбор между соперничеством и сотрудничеством. Какие решения будут принимать игроки в этих условиях? Подобные ситуации порождают так называемые дилеммы, так как оба игрока могут соперничать или сотрудничать друг с другом, и неясно, какой вариант окажется более выгодным, поскольку все будет зависеть от решения, принятого оппонентом. В целом сотрудничество игроков принесет выгоду обоим, и результат будет наилучшим для каждого из игроков, в то время как соперничество приведет к печальным последствиям. Если бы существовали лишь две эти ситуации, то дилеммы бы не было. Однако если один из игроков пытается сотрудничать с другим, а тот решает соперничать, последний будет иметь преимущество, причем оно будет больше, чем при сотрудничестве. Таким образом, дилемма очевидна.

Ввиду сложности игр подобного типа, в этой главе математические аспекты неизбежно будут смешиваться с психологическими и даже моральными. Поэтому решения часто не будут строгими решениями с точки зрения математики, а будут представлять лишь возможные исходы, которые зависят от действий игроков. Несмотря на это, подобные игры вызывают больший интерес, чем описанные в прошлой главе, так как намного чаще встречаются в реальной жизни. В реальных конфликтных ситуациях соперничество и сотрудничество очень часто сочетаются.

Можно сказать, что все множество ситуаций, изучаемых в теории игр, можно разделить на две полярные группы: игры с нулевой суммой, основанные на чистом соперничестве, и игры, основанные на чистом сотрудничестве. И те и другие легко решить, по крайней мере в теории. Игры, основанные на чистом соперничестве, рассматривались в прошлой главе. Аналогично можно анализировать ситуации, основанные на чистом сотрудничестве: действия пилота раллийного автомобиля и его штурмана, действия партнеров в танце, действия пилота самолета и диспетчера — это всё примеры ситуаций, где оба игрока имеют одну цель, и решение состоит в том, чтобы объединить усилия (эффективно координировать ходы).

Прочие игры для двух лиц, о которых рассказывается в этой главе, находятся между этими двумя крайностями. Такие игры сложнее, поскольку интересы игроков частично противоположны, а частично совпадают, хотя на первый взгляд кажется, что это не так. Представим, например, продавца квартиры и возможного покупателя. Оба заинтересованы в заключении сделки (в сотрудничестве), но не могут сойтись в цене (конфликт). Можно также рассмотреть пример слияния двух компаний или противостояние двух стран, которые ведут войну. Во всех подобных случаях большинство стратегий подразумевают конфликт, но есть возможность прийти к соглашению или подписать пакт, который частично устроит обе стороны: можно заключить перемирие или соглашение о неиспользовании ядерного оружия.

РАЗВИТИЕ ТЕОРИИ ИГР

В 1944 году была опубликована работа фон Неймана и Моргенштерна «Теория игр и экономическое поведение», в которой излагался алгоритм поиска оптимальных решений в играх с нулевой суммой для двух лиц. Именно это событие считается отправной точкой теории игр. Основным предметом исследований новой теории стали кооперативные игры и анализ оптимальных стратегий в случаях, когда оппоненты могут прийти к соглашению относительно выбранных стратегий.

В 50-е годы XX века в теории игр произошел заметный прорыв. Появились первые исследования дилеммы заключенного, Джон Нэш определил понятие оптимальной стратегии для игр со множеством игроков, когда оптимальную стратегию нельзя определить заранее (подобная ситуация известна как равновесие Нэша). Этот алгоритм применим для некооперативных игр, но может быть расширен и для кооперативных. В это же время теория игр впервые начала применяться в других областях помимо экономики, например, в философии и политологии. Позднее, уже в 1970-е годы, теория игр начала применяться в биологии в основном благодаря работам Джона Мейнарда Смита, который ввел понятие эволюционно стабильной стратегии.

Фотография Оскара Моргенштерна, который вместе с Джоном фон Нейманом является создателем теории игр.

Математика сотрудничества: игры с ненулевой суммой

Чтобы показать разницу между играми с нулевой и с ненулевой суммой, рассмотрим ситуацию, связанную с распространением рекламы. Две компании, А и Б, хотят прорекламировать свою продукцию. В обе компании поступает предложение от телеканала: рекламу можно показать днем (когда ее увидят 40% телезрителей) или вечером (тогда ее увидят 60% зрителей), причем можно выбрать только один из предложенных вариантов. Известно, что дневная и вечерняя аудитории не пересекаются. Если обе компании закажут рекламу на одно и то же время, то их продукцию купят 30% зрителей, включивших телевизор в это время, и никто из тех, кто смотрел телевизор в другое время. Если же компании закажут рекламу на разное время, то охватят 50% аудитории, которая в тот момент находилась у экранов. Какое решение оптимально для каждой компании? Будет лучше проконсультироваться с другой компанией или скрыть свои намерения?

Эту игру можно выразить в виде платежной матрицы, значения которой будут соответствовать доле аудитории. Однако в этом случае в каждую ячейку таблицы нельзя поместить какое-то одно значение, так как выигрыш одной компании не равен проигрышу другой и каждая компания будет иметь свою выгоду. По этой причине элементами матрицы будут пары значений. Первое число в каждой паре — выгода компании А, второе — выгода компании Б в зависимости от стратегий, выбранных обеими компаниями.

Если А и Б запустят рекламу днем, то каждой компании достанется 12% аудитории (30% от 40%). Если рекламные ролики выйдут в разное время, то результаты будут симметричны: если А запустит рекламу днем, а Б — вечером, то А получит 20% (половину от 40%), компания Б — 30% (половину от 60%). Если обе компании в этом случае сменят стратегии на прямо противоположные, противоположными окажутся и результаты.

Для анализа этой игры аналогично тому, как мы это делали ранее, нужно рассматривать две матрицы (с выигрышами каждого игрока), учитывая, что каждый игрок стремится максимально увеличить свой выигрыш в соответствии с платежной матрицей.

МАТРИЦА ДЛЯ ИГРОКА А

МАТРИЦА ДЛЯ ИГРОКА Б

С учетом того, что матрицы симметричны и что стратегии А указаны в строках, а стратегии Б — в столбцах, анализ обеих матриц проводится аналогичным образом. Можно выполнить те же действия, что и для игр с нулевой суммой: седловая точка отсутствует (максиминное значение равно 18, минимаксное — 12), поэтому нужно найти смешанную стратегию, чтобы определить цену игры для игрока А. Эта стратегия такова: нужно использовать стратегию 1 (выпускать рекламу днем) с вероятностью 3/5 и стратегию 2 (выпускать рекламу ночью) с вероятностью 2/5. Таким образом мы получим цену 19,2 (средний выигрыш за партию). Аналогично для игрока Б (с учетом симметрии): в каждых пяти партиях он должен произвольным образом два раза выбрать стратегию 1 и три раза — стратегию 2, при этом его средний выигрыш будет тем же. Пока что нет никаких отличий от прошлых примеров, и читатель может посчитать, что мы определили оптимальную стратегию для каждого игрока и что игра решена.

Однако более подробный анализ игры показывает, что в этом случае каждый из двух игроков ожидает выиграть больше, и при этом выигрыш другого игрока останется прежним. Поэтому предыдущее решение не является оптимальным, и цена игры, найденная для оптимальных смешанных стратегий, используемых в играх с нулевой суммой, не всегда является наибольшей.

Это происходит потому, что оптимальные стратегии в играх с нулевой суммой основаны на ограничении или уменьшении выигрыша соперника. Если игра имеет нулевую сумму, то уменьшение выигрыша одного игрока равносильно увеличению выигрыша другого, но в нашем случае это не так. Допустим, что компания Б не будет использовать смешанную стратегию и всегда будет применять стратегию 2 (выпуск рекламы вечером), в то время как компания Б будет придерживаться смешанной стратегии. В этом случае компания А в среднем получит 30 • 2/5 + 18 • 3/5 = 22,8, а компания Б — по-прежнему 19,2. Заметим, что выигрыш Б не изменился, а выигрыш А возрос. В играх с нулевой суммой это невозможно. Очевидно, компания Б может действовать подобным образом и всегда использовать чистую стратегию 2, ожидая, что А будет придерживаться смешанной стратегии. В этом случае результат Б возрастет, результат А останется на прежнем уровне.

Но что произойдет, если обе компании используют чистую стратегию 2? Обе получат лишь по 18% аудитории, выигрыш обоих игроков уменьшится одинаково. Кажется, что мы зашли в тупик: каждая компания может выиграть больше, не повредив конкуренту, но если оба игрока захотят получить больше, то, напротив, выиграют меньше среднего ожидаемого значения.

Однако возможен и другой вариант. Допустим, что оба игрока заключили соглашение, чтобы не попасть одновременно в клетки с наименьшим выигрышем, то есть не размещать рекламу в одно и то же время. В этом случае каждая компания получит больше, при этом выигрыши компаний могут стать равными: если компания А будет чередовать стратегии 1 и 2, а компания Б — чередовать стратегии 2 и 1, то средний выигрыш для обеих компаний будет равен 25% за партию. Компания А будет попеременно получать 20 и 30 процентов, компания Б — 30 и 20. Это решение кажется оптимальным и, более того, является равновесным.

Разумная мысль: равновесие Нэша

Фон Нейман и Моргенштерн, изучив игры с нулевой суммой для двух лиц, перешли к анализу игр с большим числом игроков, учитывая возможные альянсы (группы из двух игроков и более, которые действуют согласованно), то есть отошли от чисто конкурентных игр. В 50-е годы XX века именно Джон Нэш расширил теорию игр, включив в нее некооперативные игры для n игроков, где альянсы были запрещены. Нэш уделял особое внимание играм с ненулевой суммой для двух и более игроков и пришел к мысли о равновесии, которое теперь известно как равновесие Нэша.

Алгоритм Нэша (или по меньшей мере его суть) кажется простым. Допустим, что разные игроки проанализировали игру и каждый выбрал определенную стратегию. Зная результат игры, зададим каждому игроку вопрос: считает ли он результат удовлетворительным? Иначе говоря, предпочел бы он действовать иначе? Если ответ положителен, то есть все участники считают, что грамотно выбрали стратегию, то, согласно Нэшу, в игре достигнуто равновесие.

Рассмотрим применение этой идеи в конкретном случае. В следующей матрице приведены результаты игры с ненулевой суммой:

Оба игрока выбрали стратегию 2. Узнав результат, они остались довольны выбором и сочли, что сделали все возможное. Первый игрок (его стратегии указаны в строках) считает, что его выигрыш, 5, был максимально возможным. Второй игрок, узнав, что первый выбрал стратегию 2, также посчитал свой выбор оптимальным: он выиграл 2, а мог не выиграть ничего.

Эту ситуацию можно оспорить, сказав, что первый игрок сделал «правильный» выбор, потому что выбранная им стратегия (2) является доминантной, а второй игрок может решить, что стоило выбирать первую стратегию, так как в этом случае он мог выиграть 100. Однако в конкурентной игре, где каждый игрок хочет увеличить свой выигрыш, подобная ситуация невозможна, если игрок 1 будет действовать рационально.

Следовательно, из четырех возможных результатов единственным, который не вызовет неприятия игроков, является (5, 2). Этот результат и является точкой равновесия Нэша. В партии с любым другим исходом один из игроков мог бы усомниться в правильности выбора. В этом случае в терминологии Нэша решение было бы нестабильным.

Примененный нами алгоритм интересен и дает рациональное решение. В этом контексте Нэш доказал, что любая конечная игра для двух лиц имеет минимум одну точку равновесия, и расширил таким образом теорему фон Неймана о минимаксе. В играх с нулевой суммой точка равновесия совпадает с точкой, найденной по теореме о минимаксе. Однако результат Нэша интересен тем, что позволяет найти точки равновесия в играх с ненулевой суммой, как мы увидели из прошлого примера. При этом найденное решение будет обоснованным.

Однако так происходит не всегда, и порой точка равновесия выглядит непривычно и имеет необычные свойства.

ДЖОН ФОРБС НЭШ (РОД. 1928)

Возможно, труды Нэша, особенно его первые работы, являются важнейшими после работ фон Неймана за всю короткую историю теории игр. Уже в детстве Нэш продемонстрировал выдающийся интеллект и в то же время обнаружил трудности в общении с другими людьми. Он начал изучать химию, но вскоре переключился на математику, где отличался особым талантом. В 1948 году он получил стипендию Принстонского университета, где в то время работали Эйнштейн и фон Нейман, для написания докторской диссертации по теории игр под руководством Альберта Такера. В 1950 году он представил свою диссертацию — краткую и оригинальную работу о некооперативных играх. Его труд быстро нашел широкое признание среди специалистов по теории игр. Нэш придумал настольную игру на поле с шестиугольными клетками, позднее получившую название «Геке». По-видимому, Нэш не знал, что несколькими годами ранее такую же игру придумал Пит Хейн. Нэш доказал, что в этой игре должна существовать выигрышная стратегия для первого игрока.

Начиная с 1950-х годов он работал в Массачусетском технологическом институте (MIT) и в корпорации RAND — знаменитой организации ВВС США, занимавшейся стратегическими исследованиями. Спустя некоторое время после свадьбы, в 1959 году, ему пришлось пройти курс лечения от шизофрении. Впоследствии болезнь усилилась и преследовала ученого в разные годы жизни. Несмотря на болезнь, он продолжал работать и в 1994 году получил Нобелевскую премию по экономике.

В 2001 году режиссер Рон Ховард снял фильм «Игры разума», удостоенный четырех «Оскаров», в котором рассказывается о жизни Джона Нэша и в особенности о его борьбе с шизофренией, от которой он страдал на протяжении многих лет.

Дилемма заключенного и другие классические задачи теории игр

Примеры из предыдущего раздела показывают, что в играх с нулевой суммой иногда можно использовать стратегии сотрудничества, которые позволяют улучшить результат. Проблемы возникают, когда новый результат не распределяется между игроками поровну. Иными словами, стоит вопрос о том, как распределить «излишки» и довольны ли игроки рациональным распределением этих «излишков».

Меррил Флад, в свое время работавший в RAND, проанализировал различные ситуации из повседневной жизни, особенно те, в которых игрокам требовалось распределить между собой дополнительный выигрыш. Одна из таких ситуаций — продажа подержанного автомобиля. Допустим, покупатель готов купить машину у друга, который, в свою очередь, готов ее продать. Чтобы узнать стоимость машины, друзья отправляются в автомагазин, который согласен приобрести автомобиль за 1000 долларов и продать за 1300 долларов, получив минимум 300 долларов за свои услуги. Если продажа будет совершена без участия магазина, очевидно, что друзья сэкономят 300 долларов и смогут разделить эту сумму между собой. В этом случае наиболее рационально разделить эту сумму пополам, то есть продать машину за 1150 долларов. Таким образом, каждый из друзей получит по 150 долларов.

Это решение рационально, но не единственно. Один из игроков, например покупатель, может решить, что не готов платить больше 1100 долларов, то есть продавец получит 100 долларов в дополнение к установленной цене. И наоборот, продавец может установить минимальную цену в 1250 долларов, аргументируя это тем, что покупатель все равно сэкономит 50 долларов. Заметим, что если покупатель не примет предложение продавца, рационально рассудив, что выгода разделена «несправедливо», то повредит сам себе, потому что установленная цена все равно будет ниже цены магазина.

Однако мысль о «справедливом» распределении выгоды не всегда столь очевидна. Иногда может существовать несколько решений, которые будут казаться полностью обоснованными. Допустим, Михаил хочет отправиться из Барселоны в Мадрид (600 км) на машине, чтобы посетить важное совещание и вернуться на следующий день. Он узнает, что Петр, его друг, который живет в Сарагосе, тоже должен поехать в Мадрид в этот же день. Друзья решают вместе поехать на машине и туда, и обратно. Как нужно распределить расходы на поездку, учитывая, что Сарагоса расположена на полпути между Барселоной и Мадридом?

Вариант 1. Так как Михаил проедет в два раза больше, чем Петр, расходы нужно разделить на 3, Петр заплатит одну треть, Михаил — две трети.

Вариант 2. Так как Михаил проедет в одиночку половину пути, а другую половину друзья проедут вместе, то Михаил оплатит расходы за половину дороги плюс еще одну четверть, а оставшаяся четверть расходов (половина половины) придется на долю Петра. Получается, что расходы нужно разделить на 4, Петр оплатит одну четверть, Михаил — три четверти.

Чтобы подсчитать расходы на поездку, предположим, что поездка из Барселоны в Мадрид обойдется Михаилу в 600 евро (если он поедет один), а поездка из Сарагосы в Мадрид обойдется Петру в 300 евро. Если они поедут вместе, то сэкономят 300 евро. В первом варианте Михаил платит 400 евро (экономит 200), Петр платит 200 евро (экономит 100). Во втором варианте Михаил платит 450 евро (экономит 150), Петр платит 150 евро (также экономит 150). Получается, что во втором варианте выгода распределяется одинаково, а в первом распределение происходит пропорционально понесенным расходам. Таким образом, в конкретной ситуации может существовать несколько разумных и обоснованных решений.

Дилемма заключенного

Игра под названием дилемма заключенного (этот термин был предложен Альбертом Такером в 1950 году) принадлежит к числу наиболее известных задач теории игр. Это простой пример того, как две противоборствующие стороны могут соперничать или сотрудничать. Подобное встречается очень часто: в ценовых войнах, рекламных кампаниях или в гонке вооружений.

В традиционной формулировке речь идет о противостоянии двух преступников, каждый из которых может хранить молчание или свидетельствовать против другого. Однако мы рассмотрим эту дилемму на интересном практическом примере военного конфликта, которые, к сожалению, до сих пор слишком часто происходят в разных уголках планеты. Дилемма будет формулироваться так:

Две противоборствующие стороны Р1 и Р2 должны определить политику в области вооружений. Каждая из сторон может независимо от другой выбрать одну из двух стратегий:

А: отказаться сотрудничать, то есть вооружиться перед возможным военным конфликтом.

Б: сотрудничать, то есть разоружаться или наложить ограничение на некоторые виды оружия.

АЛЬБЕРТ УИЛЬЯМ ТАКЕР (1905-1995)

Такер внес важный вклад в топологию, нелинейное программирование и теорию игр. Он окончил Торонтский университет с дипломом по математике, затем защитил докторскую в Принстонском университете в 1932 году. Некоторое время он работал в Гарварде, Кембридже и Чикаго, затем вернулся в Принстон, где преподавал до 1970 года, свыше 20 лет возглавляя кафедру математики. В 1950 году он дал название самому известному и интересному парадоксу в теории игр — дилемме заключенного, а также впервые привел интерпретацию зтой задачи. Тем самым он внес фундаментальный вклад в модель соперничества и сотрудничества, над которой позднее работали Меррил Флад и Мелвин Дрешер в Принстонском университете.

Он был не только выдающимся исследователем, но и видным преподавателем, принимал участие в образовательных проектах для средней школы, за что был избран президентом Математической ассоциации Америки. Среди его учеников — нобелевский лауреат Джон Нэш.

Существует четыре возможных решения: (А, А), (А, Б), (Б, А) и (Б, Б). Первая координата в каждой паре — стратегия Р1, вторая — стратегия Р2. Возможные исходы можно представить таблицей:



Поделиться книгой:

На главную
Назад