В качестве примера рассмотрим игру, придуманную Питером Хаммерштайном и Рейнхардом Селтеном. Есть два человека, Конрад и Нико; их задача — поделить деньги друг с другом. Конрад делает первый ход и должен решить, как они разделят деньги: пополам (справедливо) или нет (несправедливо). Нико делает второй ход и должен решить, сколько денег они поделят: много или мало. Если Конрад выбирает «несправедливо», он получает в девять раз больше, чем Нико. Если Нико выбирает «много», каждый получает в десять раз больше, чем получил бы при выборе «мало». Конрад может потребовать в девять раз больше, чем Нико, и последний ничего не может с этим поделать: выбирая «мало», он наказывает не только оппонента, но и себя. Следовательно, несчастный Нико не может даже пригрозить наказать Конрада, ибо все его угрозы выбрать «мало» неубедительны. Равновесие Нэша: один выбирает «несправедливо», а другой — «много». Это не идеальный исход для Нико, но это лучшее, что можно сделать в данной ситуации56.
Равновесие возникает тогда, когда стратегия каждого игрока является оптимальной реакцией на стратегии, принятые другими игроками, и отклоняться от выбранной стратегии не выгодно никому.
Заметьте, в равновесии Нэша наилучший результат достигается не всегда. Далеко не всегда. Часто оно устанавливается между двумя стратегиями, приводящими к неудаче одного или обоих партнеров, однако ни один из них не сумеет добиться лучших результатов, даже если поступит иначе. Дилемма заключенного — как раз такая игра. В случае, когда партнеры играют в игру впервые и только один раз, существует только одно равновесие Нэша: оба партнера предают — то есть отказываются от сотрудничества.
Ястребы и Голуби
А потом один эксперимент поставил этот вывод с ног на голову. Выяснилось, что на протяжении целых 30 лет из дилеммы заключенного извлекали неверный урок. Эгоизм не является рациональным решением, если…. Если игра повторяется неоднократно.
По иронии судьбы, на решение головоломки наткнулись в сам момент ее изобретения, но впоследствии просто забыли о нем. Флуд и Дрешер сразу обнаружили весьма странный феномен. Когда они попросили двух коллег — Армена Алчия-на и Джона Уильямса — сыграть на небольшие суммы денег 100 раз, «подопытные кролики» оказались на удивление расположены к кооперации: в 60 из 100 попыток оба сотрудничали и извлекали выгоду из взаимной помощи. На протяжении всей игры каждый вел записи. В них оба отметили, что старались быть благодушными по отношению к партнеру, чтобы тот был таким же в ответ — вплоть до самого конца игры, когда каждый решил воспользоваться шансом быстренько нажиться за счет другого. Когда два человека играют многократно, в течение неопределенного периода времени явно превалирует добропорядочность, а не низость57.
О турнире Алчияна — Уильямса скоро позабыли. Впрочем, когда бы людей ни просили сыграть в «дилемму заключенного», они неизменно склонялись к сотрудничеству — тактике, с точки зрения логики, неверной. Подобную неуместную готовность к сотрудничеству снисходительно приписали их нерациональности и, в основном, не поддающейся объяснению любезности. «Очевидно, — писала одна пара теоретиков, — заурядные игроки недостаточно сведущи в стратегических вопросах и, как следствие, не понимают, что единственная рационально оправданная стратегия — это ОП (оба предают)». Мы были слишком тупы, чтобы это сообразить58.
В начале 1970-х годов один биолог снова пришел к выводам, вытекавшим из турнира Алчияна — Уильямса, только уже в своей области. Инженер-генетик Джон Мейнард Смит[30] никогда не слышал о дилемме заключенного, но полагал, что биология может использовать теорию игр не менее эффективно, чем экономика. Как рациональные индивиды должны выбирать стратегии, согласно теории игр, являющиеся «наименьшими из двух зол» в любых обстоятельствах, утверждал он, так и естественный отбор должен вырабатывать у животных инстинктивное поведение, в основе которого лежат схожие стратегии. Другими словами, к мысли о выборе равновесия Нэша можно прийти как сознательной, рациональной дедукцией, так и размышляя об эволюционной истории. Решение может принимать не только индивид, оно может быть определено отбором. Мейнард Смит назвал развитый инстинкт, отвечающий равновесию Нэша, «эволюционно стабильной стратегией»: ни одно животное, принявшее ее, не окажется в более затруднительном положении, чем то, которое выбрало другую стратегию.
Первый пример Мейнарда Смита являл собой попытку пролить свет на то, почему звери обычно не дерутся до смерти. Он представил ситуацию в виде борьбы Ястреба и Голубя. Первый, выступающий грубым эквивалентом «предательства» в дилемме заключенного, легко побеждает второго, но получает страшные раны в сражении с другим Ястребом. Голубь, выступающий эквивалентом «сотрудничества», извлекает выгоду из встречи с другим Голубем, но не может противостоять Ястребу. Если игра повторяется много раз, более мягкие качества Голубя приносят большую пользу. В частности, весьма успешной оказывается стратегия «Отпорщик» — когда он, встречаясь с Ястребом, тоже превращается в него. Более подробно мы остановимся на ней чуть позже59.
Поскольку игры Мейнарда Смита относились к сфере биологии, экономисты их проигнорировали. Но вот в конце 1970-х происходит нечто странное и, я бы сказал, тревожное. В дилемму заключенного начинают играть компьютеры. Несмотря на свои холодные, безжалостные, рациональные мозги, машины, в сущности, делают то же самое, что и глупые, наивные людишки — вопреки всякой рациональности, они стремятся к сотрудничеству. Математики забили тревогу. В 1979 году, задавшись целью изучить логику взаимодействия, молодой политолог Роберт Аксельрод организовал турнир. Он призвал коллег по всему миру разработать компьютерные программы, которые играли бы в эту игру 200 раз — против всех представленных программ, против себя и против случайной программы. В ходе соревнования каждая должна была набрать определенное количество очков.
Аксельрод провел новый турнир. Теперь перед участниками стояла задача победить «Око за око». Были испробованы 62 программы, и самой успешной оказалась… сама «Око за око», снова вышедшая на первое место.
В своей книге Аксельрод пишет:
В ходе следующего турнира Аксельрод устроил настоящую войну между стратегиями по типу «выживает сильнейший» — один из первых примеров того, что позже получило название «искусственной жизни». Естественный отбор, движущую силу эволюции, довольно легко сымитировать на компьютере: программы борются за пространство на мониторе так же, как настоящие живые существа размножаются и борются за пространство в реальном мире. В версии Аксельрода — неуспешные стратегии постепенно исчезали, оставляя все поле в распоряжение наиболее сильной программы. При этом наблюдалась целая серия увлекательных событий. Сначала «непорядочные» стратегии преуспевали за счет «добрых» и наивных. Не отставали от них только такие «отпорщики», как «Око за око». Постепенно, однако, у «непорядочных» стратегий закончились легкие жертвы. Тогда они начали сталкиваться друг с другом, и их количество стало быстро уменьшаться, в результате чего вперед вышла «Око за око». Именно она, отвоевав все поле, в итоге и стала победительницей. Опять.
Братья по крови
Полагая, что полученные результаты должны представлять немалый интерес для биологов, Аксельрод связался со своим коллегой по Мичиганскому университету — не кем иным, как Уильямом Гамильтоном. Тот был потрясен одним совпадением.
Более 10 лет назад молоденький аспирант-биолог из Гарварда Роберт Триверс показал Гамильтону написанное им эссе, в котором отметил, что животные и люди, как правило, руководствуются личной выгодой, но при этом часто сотрудничают. Одной из причин взаимодействия эгоистичных индивидов, по его мнению, являлась «реципрокность»: по сути, рука руку моет. Услуга, оказанная одним животным другому, может быть позже вознаграждена ответной, к выгоде обоих — при условии, что затраты на ее оказание меньше, чем прибыль от ее получения. Таким образом, далекие от альтруизма общественные животные могут просто-напросто эгоистично обмениваться желаемыми одолжениями. Получив поддержку от Гамильтона, Триверс опубликовал свою статью, содержавшую аргументы в пользу реципрокного (взаимного) альтруизма в мире животных, а также ряд предполагаемых примеров. Более того, как способ проверки своей идеи он даже описал повторяющуюся дилемму заключенного. И на ее основе сделал вывод: чем длительнее взаимоотношения двух индивидов, тем выше должна быть вероятность их сотрудничества. Фактически он предсказал «Око за око»62.
И тут вдруг, 10 лет спустя, в руках Гамильтона оказывается математическое доказательство реального потенциала идей Триверса. Для привлечения внимания биологов к проблеме «Око за око» Аксельрод и Гамильтон опубликовали совместную статью под названием «Эволюция сотрудничества»[32]. Результат: взрыв интереса и поиск реальных примеров среди животных63.
Последние не заставили себя долго ждать. В 1983 году биолог Джеральд Уилкинсон вернулся в Калифорнию с Коста-Рики с несколько непривлекательным примером сотрудничества. Ученый изучал летучих мышей-вампиров. Последние проводят дни в полых стволах деревьев, а ночью вылетают на поиски крупных животных, чтобы преспокойно напиться их крови через маленькие ранки в шкуре. Такая жизнь полна риска, ибо периодически летучая мышь возвращается домой голодной. Причин тому может быть две: либо она не нашла подходящий объект, либо что-то помешало трапезе. У старых особей конфуз случается в одну ночь из 10, тогда как молодые терпят неудачи в три раза чаще, и две голодные ночи подряд отнюдь не редкость. Спустя какие-то 60 часов без кровавой пищи мышь оказывается под угрозой смерти.
К счастью для летучих мышей, они могут выпить крови больше, чем им требуется в данный момент, а излишек отрыгнуть и отдать другой мыши. Акт сам по себе великодушный, щедрый. Возникает дилемма заключенного: летучим мышам, которые кормят друг друга, намного лучше, чем тем, которые этого не делают. Правда, мышам, которые принимают еду от других, но сами не делятся, лучше всех, а мышам, которые еду отдают, но не получают, — хуже всех.
Поскольку эти звери, как правило, устраиваются на ночлег в одних и тех же местах и живут достаточно долго — до 18 лет они знакомятся друг с другом и, как и компьютерные программы Аксельрода, имеют возможность играть в дилемму заключенного многократно. Соседи по ночлегу, кстати, зачастую не являются близкими родственниками. Следовательно, их щедрость нельзя объяснить непотизмом. Уилкинсон обнаружил, что летучие мыши, судя по всему, используют стратегию «Око за око». Поделившись кровью в прошлом, в будущем они получат кровь от бывшего реципиента. А отказав в крови, в будущем тоже получат отказ. Каждая летучая мышь, похоже, отлично ведет счет — возможно, это и является целью социального грумминга, которым они часто занимаются. Дело в том, что летучие мыши чистят мех друг друга, уделяя особое внимание как раз областям вокруг желудка. Мыши с раздувшимся от обильной пищи животом не так-то просто скрыть это от осматривающей ее шерсть. Обманщицу очень быстро выводят на чистую воду. Реципрокность торжествует64.
Реципрокность свойственна и африканским верветкам. Проигрывая магнитофонную запись с призывами о помощи в драке, ученые установили: обезьяны реагируют на призыв охотнее, если зовущие помогали им в прошлом. Если же две обезьяны являются близкими родственниками, реакция второй из них не так сильно зависит от того, помогала ли ей раньше первая.
Главное условие, необходимое для работы стратегии «Око за око» — стабильные, повторяющиеся взаимоотношения. Чем случайнее и нерегулярнее встречи двух особей, тем маловероятнее, что они приведут к сотрудничеству. Эта идея, заметил Триверс, подтверждается одной удивительной особенностью коралловых рифов — своеобразных станций очистки, где местная крупная рыба (включая хищников) избавляется от паразитов с помощью мелких рыбешек и креветок.
Чистка является неотъемлемой и важной частью жизни тропической рыбы. Свои услуги предлагают более 45 ее видов и минимум шесть видов креветок — причем для некоторых она является единственным источником пищи. Большинство чистильщиков выделяются особыми раскраской и поведением. На чистку приплывают рыбы всевозможных видов: кто-то из открытого океана, кто-то специально выбирается из своих убежищ под рифом. Некоторые даже меняют цвет, тем самым сигнализируя о потребности в чистке. Особенно важен этот процесс для крупной рыбы. Многие тратят на него столько же времени, сколько на кормление, и чистятся по нескольку раз в день — особенно если они ранены или больны. Если с рифа убрать чистильщиков, эффект будет мгновенен: общая численность рыб резко снизится, а количество больных по мере распространения паразитов резко повысится.
Детеныши принимают доброжелательность матери как должное, им не приходится заслуживать ее собственными щедрыми поступками.
Более мелкая рыба получает пищу, а более крупная — чистку: взаимная выгода налицо. Что любопытно, многие чистильщики имеют те же размер и форму, что и добыча рыб, которых они чистят, но бесстрашно шныряют туда-сюда в пасти своих клиентов, проплывают между жабрами и, по сути, играют со смертью. При этом они не только остаются целым и невредимыми. «Клиенты» даже подают осторожные и хорошо понимаемые сигналы — мол, с меня хватит, я поплыл дальше. И чистильщики тут же бросаются прочь. Инстинкты, управляющие связанным с чисткой поведением, чрезвычайно сильны. Триверс приводит в пример одного крупного морского окуня, который в течение шести лет жил в аквариуме, пока не вырос до метровой длины и не привык кидаться на любую рыбу, которую ему бросали. Как ни странно, встретив первого в своей жизни чистильщика, он тут же разинул пасть и растопырил жабры, хотя никаких паразитов у него в помине не было.
Загадка в том, почему клиенты никогда не гонятся за двумя зайцами: казалось бы, почистись, а потом возьми да и слопай чистильщика (эквивалент предательства в дилемме заключенного). Но этого не происходит — по той же самой причине, по которой редки предательства. Что вам ответит аморальный ньюйоркец, если вы спросите его, зачем он платит своей домработнице — нелегальной иммигрантке? Ведь он может просто уволить ее, а на следующей неделе нанять другую? Рыбы рассуждают аналогичным образом: хороших чистильщиков трудно найти. Клиенты берегут их не из общего чувства долга перед будущими клиентами, а потому что хороший чистильщик представляет большую ценность в виде чистильщика, чем в виде корма. Чистильщика можно найти в одном и том же месте на одном и том же рифе. День за днем. Год за годом. Перманентность и продолжительность взаимоотношений — в данном случае ключевые факторы.
Одноразовые встречи способствуют предательству; частое повторение — сотрудничеству. В открытом-то океане станций чистки нет66.
Другой пример, который изучал Аксельрод, касался Западного фронта в Первой мировой войне. Поскольку в результате создалась патовая ситуация, война превратилась в одну нескончаемую битву, которая велась на одном и том же месте, и встречи между двумя армиями повторялись снова и снова. Это повторение, равно как и повторение игр в дилемме заключенного, изменили разумную тактику с враждебности на сотрудничество. Западный фронт и в самом деле был буквально «зачумлен» неофициальными перемириями между союзниками и немецкими частями, достаточно долгое время стоявшими друг против друга. С помощью искусных систем коммуникации согласовывались условия, извинялись за случайные нарушения и гарантировали относительный мир. И все это — без ведома командования с обеих сторон. Исполнение соглашения о перемирии обеспечивалось простой местью. Для наказания противника за предательство использовались рейды и артиллерийские удары — причем ситуация нередко выходила из-под контроля, как обыкновенная кровная вражда. Следовательно, происходящее здорово смахивало на стратегию «Око за око»: стороны стремились ко взаимному сотрудничеству, но отвечали предательством на предательство. Когда соглашения о перемирии наконец обнаружились, генералы обеих сторон применили простое и эффективное «лекарство»: части стали регулярно перемещать. Отныне ни один полк не находился против другого достаточно долгое время, чтобы между ними успели установиться взаимоотношения сотрудничества.
Впрочем, пример из Первой мировой войны четко показывает: у стратегии «Око за око» есть и темная сторона. Если два игрока встречают друг друга и начинают свои взаимоотношения должным образом, они сотрудничают. Но если один из них случайно предает, следует продолжительная серия обоюдных укоров, от которой в буквальном смысле нет спасения. В этом-то и заключается смысл фразы «око за око» для тех, кто склонен (или был склонен) к кровной мести и фракционной вражде — например на Сицилии, в шотландских границах в XVI веке, в Древней Греции и в современной Амазонии. Далее мы убедимся, что стратегия «Око за око» — отнюдь не универсальная панацея.
Глава четвертая. Из которой следует, что иметь хорошую репутацию выгодно
Как отличить ястребов от голубей
«Каждый организм будет помогать своим сородичам, если ему это выгодно. За неимением другого выбора, он добровольно встает под ярмо рабского служения общему благу. Но как только появится возможность действовать в собственных интересах, ничто, кроме целесообразности, не помешает ему изранить, покалечить, убить своего брата, полового партнера, родителя или детеныша. Оцарапав «альтруиста», вы увидите, как истекает кровью «лицемер».
Для своего размера летучие мыши обладают очень большим мозгом. Дело в том, что новая кора (неокортекс) — умная область в передней части мозга — непропорционально велика по сравнению с участками, расположенными ближе к задней его части. Самой большой новой корой из всех летучих мышей обладают мыши-вампиры. Не случайно именно им свойственны более сложные, чем большинству других летучих мышей, взаимоотношения — включая, как мы уже убедились, реципрок-ность между не связанными родственными узами членами группы. Чтобы играть в реципрокность, вампирам необходимо, во-первых, распознавать друг друга, во-вторых, помнить, кто ответил услугой на услугу, а кто нет, и, в-третьих, соответственно, либо простить долг, либо затаить обиду. В двух самых умных семействах сухопутных млекопитающих — у приматов и хищников — наблюдается тесная взаимосвязь между размером мозга и численностью социальной группы. Чем больше общество, в котором живет особь, тем больше новая кора относительно остального мозга. Чтобы преуспевать в сложном обществе, нужен большой мозг. Чтобы приобрести большой мозг, нужно жить в сложном обществе. Как ни крути, взаимосвязь убедительна67.
Более того, она настолько тесная, что может быть использована для прогнозирования размера группы, свойственной всему виду. Согласно этой логике, люди живут в сообществах по 150 человек. Хотя многие города и мегаполисы гораздо крупнее, указанная цифра довольно точна. Примерно столько людей в типичных группах охотников-собирателей, в религиозной общине, в адресной книге, в роте. Именно такое количество сотрудников предпочитают работодатели на легко управляемой фабрике. В общем, это те люди, которых каждый из нас хорошо знает68.
Реципрокность работает только в том случае, если люди распознают друг друга. Нельзя ответить услугой на услугу или затаить обиду, если неизвестно, как найти и выявить благодетеля или врага. Кроме того, в ходе обсуждения теории игр мы упустили из виду важнейший ингредиент реципрокности — репутацию. В обществе индивидов, которых вы различаете и хорошо знаете, вам никогда не приходится решать дилемму заключенного вслепую. Вы можете выбирать партнеров. Например тех, с кем уже сотрудничали в прошлом. Или тех, кому, по словам окружающих, можно доверять. Наконец тех, кто сигнализирует о готовности сотрудничать. Одним словом, вы вправе проявить разборчивость.
В крупных, космополитических мегаполисах с грубостью, оскорблениями и жестокостью сталкиваешься чаще, чем в маленьких городках и сельской местности. Где это видано, чтобы в пригороде или деревне люди ездили так, как они это делают в Манхэттене или центре Парижа — грозя кулаками другим водителям, сигналя и выказывая свое нетерпение всевозможными способами? Почему так происходит — давно известно. Большие города анонимны. Незнакомцам в Нью-Йорке, Париже или Лондоне можно грубить сколько угодно, ибо шанс встретиться с ними снова ничтожно мал (особенно если вы на машине). Что сдерживает нас в пригороде или деревне, так это острое осознание реципрокности. Если вы грубите, велика вероятность, что в ответ будут грубить вам. Если вы добры и внимательны по отношению к окружающим, есть хороший шанс, что вам ответят той же предупредительностью.
В условиях, в которых развивались люди — в маленьких племенах, где встречи с посторонним были крайне редки — подобный смысл реципрокного обязательства наверняка ощущался особенно остро. Так оно и есть среди сельских жителей. Возможно, в основе социального инстинкта человека действительно лежит стратегия «Око за око». Возможно, именно она объясняет, почему, с точки зрения социальных инстинктов, из всех млекопитающих люди наиболее близки голым землекопам.
Охота на Снарка[33]
После турниров Роберта Аксельрода стратегия «Око за око» вызвала некоторое — не скажу, чтобы очень уж яростное — недовольство. И у экономистов, и у зоологов нашлись свои возражения.
Последним «Око за око» не угодила тем, что хороших ее образчиков в природе чрезвычайно мало. Кроме летучих мышей Уилкинсона, рифовых станций очистки Триверса, дельфинов и обезьян эту стратегию никто не практикует. А немногочисленные примеры — результат весьма плачевный, учитывая, сколько усилий было затрачено на ее поиски в 1980-х годах. Выходит, зря старались? Для некоторых зоологов вывод однозначен: животные должны применять стратегию «Око за око», но почему-то этого не делают.
Признаки наказания отстающих, или реципрокности, отсутствуют, и лидерам приходится мириться с тем, что их отвагу не оценили. Львицы стратегию «Око за око» не применяют.
Хороший пример — львы. Самки живут сплоченными прайдами, каждый из которых защищает свою территорию от конкурентов (самцы прибиваются к прайду ради спаривания и практически ничего не делают — разве что гоняют других самцов). Львицы обозначают свои владения рычанием, а значит, их легко обмануть: если надлежащим образом проигрывать записанный на магнитофонную пленку рык, они решат, что столкнулись с серьезным вторжением. Роберт Хейнсон и Крейг Пакер провели такой эксперимент с несколькими танзанийскими львами и понаблюдали за их реакцией.
Желая выяснить, что случилось, львицы пошли на звук: одни с энтузиазмом, другие весьма неохотно. Какая плодородная почва для «Око за око»! Смелая самка, возглавляющая поход к «интервенту», вроде бы, должна ожидать ответной услуги от плетущейся сзади трусихи: в следующий раз та поведет и подвергнется основной опасности. Но Хейнсон и Пакер подобной модели не обнаружили. Лидеры распознают отстающих, поглядывают на них словно с укором, но и в следующий раз ведут они же. Отстающие есть отстающие, что с них возьмешь?
Тот факт, что другим животным «Око за око» не свойственна, не доказывает, что и люди не могут строить свои общества на принципах реципрокности. В следующих главах мы убедимся: доказательства того, что человеческое общество отягощено реципрокными обязательствами, есть, их много и это количество постоянно растет. Как речь и противопоставленный большой палец, реципрокность вполне может являться одной из тех черт, которые мы развили для собственного пользования, но некоторые другие животные пользуются ею или по крайней мере имеют к этому умственную предрасположенность. Иными словами, Кропоткин мог ошибаться, предполагая взаимную помощь у насекомых на том лишь основании, что она характерна для людей. И все-таки, возражения зоологов не так уж небеспочвенны. Судя по всему, простая идея «Око за око» лучше подходит для упрощенного мира компьютерных турниров, чем для того бардака, который представляет собой реальная жизнь.
Ахиллесова пята «Око за око»
Экономистам стратегия «Око за око» доставила иные неприятности. Открытия Аксельрода, опубликованные в серии статей, а позже — в книге под названием «Эволюция сотрудничества»[34], захватили воображение общественности и широко освещались в прессе. Уже один этот факт должен был вызвать презрение к ним со стороны завистливых теоретиков игр. Так и случилось: язвительные замечания не заставили себя долго ждать.
Хуан-Карлос Мартинез-Колл и Джек Хиршлейфер решили рубить с плеча: «Широкое признание в последнее время получило весьма странное заявление. Дескать, простое реципрокное поведение, известное как «Око за око», является лучшей стратегией не только в особой среде, смоделированной Аксельродом, но и вообще». С равным успехом (и легкостью), утверждали они, можно создать такие условия, в которых «Око за око» окажется не столь успешной. Наибольшее же беспокойство вызывает кажущаяся невозможность симулировать мир, предполагающий сосуществование непорядочных и добропорядочных стратегий — а ведь это мир, в котором мы живем70.
В число наиболее ярых критиков входил и Кен Бинмор[35]. Необходимо отметить, писал он, что даже в симуляциях Аксельрода «Око за око» никогда не выигрывает у более «гадкой» стратегии в условиях единичной игры: следовательно, применять «Око за око» в случаях, когда речь идет об одной игре, а не их серии — плохой совет. Да вы просто болван, если так поступаете. Аксельрод, как вы, наверное, помните, суммировал очки, заработанные в матчах между многими различными стратегиями. «Око за око» победила за счет комбинации ничьих и поражений, дававших большое количество баллов, а не за счет безоговорочной победы во всех турах.
Бинмор убежден: сам факт того, что идея «Око за око» кажется нам такой естественной — «глубоко внутри все мы понимаем, что именно благодаря реципрокности наше общество функционирует должным образом» — заставляет нас слепо принимать ее математическое обоснование. «Необходимо все хорошенько обдумать, — прибавляет он, — прежде чем соглашаться с общими выводами, экстраполированными из компьютерных симуляций»71.
Большинство скептиков упустили из виду главное. Критиковать Аксельрода за то, что он, видите ли, не сумел охватить все происходящее в мире равно критике Ньютона за то, что он не объяснил политику с точки зрения силы тяжести. Все думали, что дилемма заключенного преподает суровый, жестокий урок — единственным рациональным решением является предательство, и со стороны людей не понимать это просто глупо.
Что же касается аргумента, будто «Око за око» выигрывает, потерпев поражение там, где оно приносит наибольшее количество очков, то в этом-то вся и суть. Эта стратегия уступает или заканчивает вничью отдельные битвы, зато выигрывает войну, заработав максимальное количество баллов. Она не завидует и не стремится «обойти» оппонента. Жизнь, верит она, это не игра с нулевой суммой, мой успех не зависит от твоего провала, мы оба можем «победить». «Око за око» расценивает каждую игру не как соревнование, а как сделку между участниками.
Ряд народов высокогорной центральной части Новой Гвинеи, живущих в мире опасных, нестабильных, но реципрокных альянсов и вечной вражды между племенами, недавно пристрастился к футболу. Однако, обнаружив, что поражение чересчур пагубно сказывается на кровяном давлении, слегка изменил правила: матч продолжается до тех пор, пока каждая из сторон не забьет определенное количество голов. Всем весело, проигравших нет, и каждый забивший мяч может считать себя победителем. Это не игра с нулевой суммой.
«Ну, как вы не понимаете? — восклицал после одного такого матча новоприбывший священник-рефери. — Цель игры — победить соперника. Кто-то обязательно должен выиграть!» «Нет, отец, — терпеливо отвечали капитаны команд. — Все не так. Только не здесь, не в Асмате. Если кто-то выиграет, значит, кто-то проиграет — а это никуда не годится»72.
Такие рассуждения кажутся, мягко говоря, странными. Но лишь потому, что нам инстинктивно трудно их понять — по крайней мере, в контексте игры (лично я сомневаюсь в прелестях новогвинейского футбола). Рассмотрим торговлю. Для экономистов обоюдная прибыль — аксиома. Если две страны расширяют торговлю, обеим лучше. И все же, обыватель — не говоря уж о его представителе-демагоге — видит это несколько иначе. Для него торговля это конкуренция: экспорт — хорошо, импорт — плохо.
Вообразите турнир по футболу, слегка отличающийся от новогвинейского. Пусть в этом соревновании победителем станет не тот, кто выиграл больше всего матчей, а тот, кто забил больше всех мячей. Теперь представьте, что несколько команд решили сыграть в нормальный футбол: то есть их основная задача — пропустить как можно меньше мячей и набрать как можно больше очков. Остальные участники пробуют иную стратегию: сначала позволяют соперникам забить гол, а потом стараются сделать это сами. По возможности оппоненты поступают так же, и так далее. Какие команды наиболее успешны, видно сразу: конечно, те, что используют стратегию «Око за око». Иными словами, из игры с нулевой суммой футбол превратился в игру с ненулевой суммой. Именно этого добился и Аксельрод: он превратил дилемму заключенного из игры с нулевой суммой в игру с ненулевой суммой. В жизни-то первая встречается очень редко.
В одном важном аспекте, однако, Бинмор и другие критики оказались правы. Аксельрод слишком поторопился, заключив, что сама стратегия «Око за око» является эволюционно стабильной — то есть популяция, применяющая ее, защищена от вторжения той, которая использует любую другую стратегию. Этот вывод опровергли дальнейшие компьютерные симуляционные соревнования, похожие на третий турнир Аксельрода. В ходе них Роб Бойд и Джеффри Лорбербаум показали, насколько легко создать условия, в которых «Око за око» не побеждает.
Эти турниры, напомню, подразумевают борьбу случайной комбинации стратегий друг против друга за контроль над ограниченным пространством — путем размножения со скоростью, определяемой количеством заработанных в предыдущей игре очков: 5, з, 1 или о. Наиболее успешными поначалу являются непорядочные («гадкие») — такие, как «Всегда предавай»: эксплуатируя наивные кооперативные стратегии, они постепенно вытесняют их. Но вскоре и они слабеют: встречаясь только друг с другом, они получают всего по одному очку, и на первый план выходит «Око за око». Играя против «Всегда предавай», она скоро тоже начинает предавать (тем самым лишая оппонента искушения ценой в пять очков), а играя против себя самой, сотрудничает и набирает по три балла. Выходит, пока стратегии «Око за око» могут найти себе подобных и сформировать пусть маленький, но кооперативный кластер, они будут процветать и, в конечном счете, доведут до вымирания «Всегда предавай»73.
Если стрелок ирландской республиканской армии, целясь в британского солдата, убивает невинного наблюдателя-протестанта, ошибка может привести к ответному убийству.
Но тут-то и проявляется слабое место «Око за око»: она подвержена ошибкам. Если вы помните, эта стратегия сотрудничает до тех пор, пока не столкнется с предательством, которое затем наказывает. Как правило, два игрока «Око за око» благополучно сотрудничают, но если один вдруг предает (по ошибке, по случайности), второй начинает мстить. В результате получается замкнутый круг чрезвычайно неприбыльного обоюдного предательства. Рассмотрим пример из реальной жизни.
Введите Павлова
Перенесемся в Вену. Конец 1980-х годов. Карл Зигмунд, одаренный математик с весьма игривым складом ума, ведет семинар по теории игр. Один из присутствующих студентов, Мартин Новак, тут же решает бросить химию и полностью отдаться изучению данной темы. Зигмунд, приятно удивленный напором своего ученика, ставит перед ним нелегкую задачу: разобраться в дебрях сложностей, окруживших дилемму заключенного после появления стратегии «Око за око». Найдите мне идеальную стратегию в реалистичном мире, предложил Зигмунд.
Новак разработал собственный турнир: он отличался отсутствием какой бы то ни было определенности и был построен на статистике. Стратегии либо совершали случайные ошибки с определенной вероятностью, либо меняли тактики по тому же вероятностному принципу. Система, однако, могла «учиться» или развиваться, сохраняя улучшения и отказываясь от неудачных тактик. Постепенному эволюционному изменению подвергались даже те вероятности, с которыми совершались те или иные действия. Такой новый реализм оказался чрезвычайно полезен, ибо устранил все излишние усложнения. Вместо нескольких стратегий, в равной степени способных выиграть, четкое лидирующее положение занимала одна. И это была не «Око за око», а ее очень близкая родственница — «Великодушная око за око» (которую я для краткости буду называть просто «Великодушной»).
Эта стратегия иногда прощает единичные ошибки. Иными словами, примерно треть всего времени она прощает разовое предательство. Прощение всех единичных предательств — стратегия, известная как «Око за два ока» — подразумевает явную эксплуатацию. А вот прощение время от времени (примерно с 30-процентной вероятностью) оказалось на удивление эффективным: оно помогало разорвать циклы взаимных упреков, не подвергаясь при этом эксплуатации со стороны предателей. В компьютерной популяции игроков «Око за око», совершающих периодические ошибки, «Великодушная» будет распространяться за счет последних. Как это ни парадоксально, «Око за око» фактически, прокладывает дорогу стратегии, более доброй, чем она сама. Это Иоанн Креститель, а не сам Мессия.
Впрочем, и «Великодушная» — тоже не Мессия. Она настолько великодушна, что позволяет распространяться еще более добрым, более наивным стратегиям. Например простая «Всегда сотрудничай» может преуспевать среди «Великодушных» игроков, хотя на самом деле не побеждает их. Но «Всегда сотрудничай» — стратегия фатально великодушная; ее легко побеждает «Всегда предавай», самая непорядочная из всех. В популяции «Великодушных» игроков «Всегда предавай» ни к чему ни приводит. Но стоит кому-то начать использовать «Всегда сотрудничай», как она наносит удар. Так, вместо счастливого мира взаимности мы получаем вот что. «Око за око» вводит в игру «Великодушную», та может ввести «Всегда сотрудничай», которая может развязать постоянное предательство — и вот мы опять возвращаемся к тому, с чего начали. Один из выводов Аксельрода оказался ошибочен: в этой игре стабильного исхода нет.
Лето 1992 года застало Зигмунда и Новака глубоко опечаленными: их обоих угнетало отсутствие устойчивого решения дилеммы заключенного — а такие вещи теоретики игр не любят. Впрочем, судьба распорядилась так, что жене Зигмунда, историку по профессии, предстояло провести несколько месяцев в Нижней Австрии в сказочном замке Розенбург, принадлежавшем графу, чьих предков она в то время изучала. Зигмунд пригласил Новака: они привезли с собой пару ноутбуков и с головой погрузились в турниры по дилемме заключенного. В замке обучали ловчих птиц, и днем наших математиков каждые два часа отвлекали соколы: отрабатывая технику полета, они то камнем падали вниз с высоты 300 метров, то взмывали вверх. Средневековое окружение идеально подходило для организованных внутри компьютеров поединков!
Зигмунд и Новак вернулись к самому началу и внесли в турнирные таблицы все ранее отвергнутые стратегии. Главной целью поисков стал вариант, который бы не только выиграл турнир, но и остался стабильным после него. Кроме того, они наделили своих игроков большей памятью. Вместо того, чтобы реагировать на последний ход партнера, как делает «Око за око», новые стратегии помнили собственные предыдущие ходы и действовали соответственно. И вот однажды, пока мимо окна носились соколы, на исследователей снизошло вдохновение.
Другое название стратегии «Простак» — «Павлов». Хотя, по мнению некоторых, это еще более обманчиво, ибо рефлексивной данная стратегия не является — как раз наоборот. Новак признает, что ему следовало дать ей более неуклюжее, зато и более точное имя «Победа — повторяй/поражение — меняй». Но, поскольку он так этого и не сделал, «Павловым» она и осталась. Эта стратегия — сродни игроку в рулетку (точнее, несколько упрощенной его версии). Если он выигрывает, поставив на красное, то ставит на красное и в следующий раз. А если проигрывает, то пробует черное. В нашем случае выигрыш — 3 или 5 очков («награда» и «искушение»), проигрыш — 1 или о («наказание» и «штраф простофиле»). Такой принцип — отказ менять свое поведение, пока оно дает желаемый результат, — лежит в основе большей части повседневной деятельности, включая дрессировку собак и воспитание детей. Последнее целиком и полностью построено на допущении, что малыши будут совершать поступки, за которые их вознаграждают, и прекратят делать то, за что их наказывают.
Такой принцип — отказ менять свое поведение, пока оно дает желаемый результат, — лежит в основе большей части повседневной деятельности, включая дрессировку собак и воспитание детей.
Для стратегии «Павлов» характерна добропорядочность (как «Око за око») — ибо она устанавливает сотрудничество, взаимность — ибо она отвечает добротой на доброту, и прощение (как «Великодушной») — ибо она наказывает за ошибки, но потом вновь возвращается к сотрудничеству. При всем этом ей свойственна мстительность, позволяющая эксплуатировать таких наивных кооператоров, как «Всегда сотрудничай». Играя против простофили, «Павлов» всегда предает. Таким образом, он создает сотрудничающий мир, не позволяя последнему превратиться в слишком доверительную утопию, где будут процветать «халявщики».
Слабое место этой стратегии хорошо известно. Как обнаружил Рапопорт, она беспомощна перед непорядочной «Всегда предавай». «Павлов» постоянно смещается к сотрудничеству и получает «штраф простофиле» — отсюда, кстати, и ее первоначальное название «Простак». Иными словами, «Павлов» не может распространиться, пока «Око за око» не сделает свое дело и не устранит «плохих ребят». Впрочем, Новак и Зигмунд обнаружили, что такой изъян «Павлова» проявляется исключительно в детерминированной игре — той, в которой все стратегии определены заранее. В более реалистичном мире вероятностей и обучения, где каждая стратегия бросала кубик, чтобы решить, как поступить дальше, происходило нечто совершенно иное. «Павлов» быстро приспособил вероятности таким образом, что его превосходство больше не могло быть оспорено «Всегда предавай». Вот она, подлинная эволюционно стабильная стратегия74.
Рыбьи игры: кто струсит первым?
А используют ли стратегию «Павлов» животные или люди? Пока Новак и Зигмунд не опубликовали свои идеи, одним из лучших примеров «Око за око» в животном мире являлся эксперимент Манфреда Милински с рыбой колюшкой. Ее и другую мелкую рыбешку ест щука. Стоит той появиться поблизости, как от косяка отделяется разведгруппа, которая осторожно приближается, оценивая представляемую хищником опасность. Эта явная глупая отвага должна чем-то оправдываться. Натуралисты полагают, что она дает потенциальной добыче ценную информацию. Если, например, разведчики приходят к выводу, что щука не голодна, косяк преспокойно продолжает кормиться дальше.
Когда две колюшки одновременно изучают хищника, они продвигаются вперед серией коротких рывков — причем каждый раз инициативу проявляет только одна рыбка, которая, следовательно, берет на себя основной риск. Если щука шевельнется, обе бросаются наутек. Согласно Милински, подобное поведение, по сути, представляет собой серию маленьких дилемм заключенного. Каждая рыбка должна выбрать либо «сотрудничество», сделав следующий рывок вперед, либо «предательство», предоставив дальнейшее продвижение партнеру. С помощью хитроумной системы зеркал Милински предоставлял каждой рыбке видимого компаньона (на самом деле, это было ее собственное отражение). По мере приближения к щуке «компаньон» либо держался рядом, либо все больше и больше отставал. Сначала исследователь истолковал полученные результаты с точки зрения стратегии «Око за око»: рыбка-испытуемая вела себе смелее с сотрудником, чем с предателем. Но, услышав о стратегии «Павлов», он вспомнил: в ситуации, когда ранее сотрудничавший компаньон начинал предавать, рыбка-испытуемая постоянно переключалась с сотрудничества на предательство и обратно — как и подразумевает стратегия «Павлов» и не подразумевает «Око за око».
Впрочем, «Павлов» — это еще не конец истории. Поскольку Новак переехал в Оксфорд, Кембридж, разумеется, не мог остаться в стороне: рано или поздно кто-то должен был принять вызов и победить эту стратегию. Таким человеком оказался Маркус Фрин: он представил более реалистичную версию игры, не требующую от участников делать ходы одновременно. Летучие мыши, например, оказывают друг другу услуги по очереди. Собственно, обмениваться кровью шутки ради — довольно бессмысленно. Фрин провел в своем компьютере турнир по «очередной дилемме заключенного» и таки нашел стратегию, победившую «Павлова» и получившую название «Строгая, но справедливая». Как и «Павлов», она сотрудничает с сотрудничающими, возвращается к этому после обоюдного предательства и наказывает предателя дальнейшим предательством. Однако, в отличие от «Павлова», «Строгая, но справедливая» продолжает сотрудничать после того, как в предыдущем раунде оказалась простофилей. Следовательно, она немного «добрее».
Суть проведенного Фрином турнира отнюдь не в том, чтобы провозгласить «Строгую, но справедливую» новым божеством, а в том, что асинхронность игры делает осмотрительное великодушие еще более вознаграждающим. Это согласуется со здравым смыслом. Если вы делаете ход раньше партнера или наоборот — целесообразно сотрудничество, которого вы (по крайней мере, иногда) можете добиться, будучи добрым. Другими словами, вы не встречаете незнакомцев с хмурым видом, иначе они составят о вас плохое мнение. Поэтому вы встречаете их с улыбкой.
Первые морализаторы
Но тут мы сталкиваемся с очередной проблемой — причем гораздо серьезнее предыдущих. Дилемма заключенного — игра с двумя участниками. Похоже, если два индивида играют в нее в течение неопределенного периода времени, сотрудничество возникает самопроизвольно. Или, говоря точнее, встречаясь лишь с непосредственным соседом, доброе отношение к нему оправдывает себя. Беда в том, что мир не таков.
Добиться сотрудничества трудно даже внутри пары: оба игрока должны быть способны контролировать свое соглашение — а это реально только при уверенности в повторной встрече и возможности распознать друг друга в дальнейшем. Насколько сложнее это сделать, когда речь идет о трех или большем количестве участников? С увеличением группы выгоды от кооперации все менее доступны, а препятствия, стоящие у нее на пути, все серьезнее. И действительно, Роб Бойд утверждал: для объяснения сотрудничества в крупных группах не подходит не только «Око за око», но и любая другая реципрокная стратегия. Причина в том, что успешная стратегия в большом коллективе должна быть в высшей степени интолерантной даже к редкому предательству, иначе халявщики («зайцы») — индивиды, предающие и не отвечающие услугой на услугу — быстро распространятся за счет более добропорядочных граждан. Но вот в чем загвоздка: свойства, делающие стратегию интолератной к редкому предательству, одновременно препятствуют объединению сторонников реципрокности, если они сами редки75.
Одно из возможных решений предлагает тот же Бойд. Реципрокное сотрудничество может развиться, считает он, если существует механизм наказания не только предателей, но и тех, кто предателей не наказывает. Бойд называет эту стратегию «моралистической»: как правило, она может вызвать распространение и сотрудничества, и любого индивидуально затратного поведения — вне зависимости от того, приносит оно пользу группе или нет. Утверждение весьма пугающее, отдающее авторитарностью. Если «Око за око» предполагает распространение добропорядочного поведения в группе корыстных эгоистов в отсутствие диктующего эту добропорядочность авторитета, то в морализме Бойда проглядывает власть, которой обладает фашист или лидер культа.
В крупных группах есть и другой, потенциально более действенный способ борьбы с халявщиками: мощь социального остракизма. Распознав предателя, люди могут просто-напросто отказаться с ним играть. Это лишает его искушения (5), награды (з) и даже наказания (l). Он вообще не получает возможности заработать очки.
Специально для изучения силы наказания философ Филип Китчер придумал «опционную дилемму заключенного». Он населил компьютер четырьмя типами стратегов: разборчивыми альтруистами (играли только с теми, кто никогда не предавал их раньше), усердными предателями (всегда пытались предать), одиночками (уклонялись от любых встреч) и избирательными предателями (были готовы играть с теми, кто никогда не предавал раньше, чтобы затем самим вероломно предать их).
В своих суждениях о том, можно ли доверять тому или иному партнеру, программы Китчера руководствовались их поведением в прошлом.
Разборчивые альтруисты, сталкиваясь друг с другом и получая «награду», постепенно завоевывают сообщество одиночек и вскоре начинают превалировать.
Однако выбор между альтруистами не требует подобной ретроспекции. Распознавать и избегать потенциальных предателей можно заранее. Экономист Роберт Фрэнк провел эксперимент, дав возможность группе незнакомцев пообщаться друг с другом в течение получаса. После этого он попросил каждого сделать прогноз: кто в одной единственной игре «Дилемма заключенного» будет сотрудничать, а кто предаст. Количество верных предсказаний оказалось существенно выше числа случайных догадок. Спустя каких-то 30 минут испытуемые знали друг о друге достаточно, чтобы весьма точно определить готовность каждого к сотрудничеству.
Фрэнк отнюдь не утверждает, будто это так уж удивительно. Мы тратим уйму времени на оценку благонадежности других людей и с определенной долей уверенности выносим мгновенные суждения. Для тех, кого результаты не убедили, Роберт предлагает следующий умозрительный эксперимент. «Среди тех, кого вы знаете, есть ли кто-нибудь, кто предпримет, скажем, 45-минутное путешествие, чтобы избавиться от токсичного пестицида надлежащим образом? Если да, то вы допускаете, что люди способны прогнозировать предрасположенность к сотрудничеству»77.
Можно ли доверять рыбе?
Вот оно, новое и веское основание быть порядочным: благодаря этому вы убеждаете других людей играть с вами. Награда сотрудничества
Разумеется, для того, чтобы подобная система работала, индивиды должны научиться распознавать друг друга — а это далеко не просто. Понятия не имею, говорит ли себе когда-нибудь сельдь в косяке из 10 тысяч особей или муравей в колонии из 10 тысяч насекомых: «А, вот опять старина Фред». Впрочем, я ничем не рискую, полагая, что нет. С другой стороны, убежден: верветка по голосу и внешнему виду узнает каждого члена своей стаи — приматологи Дороти Чини и Роберт Сейфарт это доказали. Выходит, обезьяна обладает качествами, необходимыми для взаимного сотрудничества, а селедка — нет.
Не исключено, конечно, что я зря наговариваю на рыбу. Манфред Милински и Ли Алан Дугаткин обнаружили удивительно четкий паттерн остракизма у колюшки, когда та рискует своей жизнью, изучая хищника. Она готова терпеть многократное предательство со стороны другой рыбки, сотрудничавшей с ней в прошлом, но не той, которая этого не делала. Кроме того, во время вылазки колюшки склонны каждый раз выбирать одних и тех же партнеров для сопровождения — как правило, тех, кто постоянно сотрудничает.
Другими словами, они не только вполне способны распознавать других особей, но и, похоже, «ведут индивидуальный счет» — то есть помнят, какой рыбке можно «доверять», а какой нет.
Открытие Милинского и Дугаткина, безусловно, озадачивает — учитывая редкость реципрокной кооперации в животном мире. По сравнению с непотизмом, объясняющим сотрудничество муравьев и любого другого существа, заботящегося о подрастающем поколении, примеры реципрокности оказались весьма немногочисленными.