Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Вероятности и неприятности. Математика повседневной жизни - Сергей Борисович Самойленко на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:

Сергей Самойленко

Вероятности и неприятности

Математика повседневной жизни

Москва«Манн, Иванов и Фербер»2022

Серия «Наука для всех»

Научный редактор Евгений Поникаров

© Сергей Борисович Самойленко, 2022

© Оформление. ООО «Манн, Иванов и Фербер», 2022

* * *

Введение

В далеком 1977 году в свет вышла книга, которую быстро начали разбирать на цитаты все кому не лень — от журналистов до ученых. Выдержки из нее превратились в «народную мудрость», стали появляться в заголовках газет и журналов и даже упоминаться в серьезных научных трудах. Однако сама по себе она ничему не учила, в ней не предлагалось новаторских методик, она не раскрывала глаза на какую-то «правду». В ней можно было найти только то, что хорошо известно всем на свете, и именно этим она подкупила читателя. Книга называлась «Закон Мёрфи и другие причины, почему все идет не так», а написал ее американский публицист Артур Блох[1]. Почему же некие «законы» пришлись по душе широкой публике? Потому что они относятся к повседневным неприятностям, досадным совпадениям, надоевшему несовершенству нашего мира. А мы, люди, очень любим жаловаться. Особенно когда жалобы «объективны». Иначе говоря, виноваты в неприятностях могут быть какие угодно обстоятельства, случайности или закономерности, но только не тот, кто жалуется, и не тот, кто его выслушивает.

В этой книге речь тоже пойдет о различных неприятностях. Привычных, ожидаемых и настолько предсказуемых, что они получили статус «законов». Их в книге Блоха и нами самими сформулировано великое множество, это и закон падающего бутерброда, и закон Мёрфи[2]: «Если какая-нибудь неприятность может произойти, она случится», — и законы Чизхолма, утверждающие: «Когда все идет хорошо, что-то должно случиться в самом ближайшем будущем», и наблюдение Этторе: «Соседняя очередь всегда движется быстрее». Большая их часть вполне тривиальна, но, согласно закону Муира, «Когда мы пытаемся вытащить что-нибудь одно, оказывается, что оно связано со всем остальным». Наша задача — найти рациональное зерно этих закономерностей. Не для того, чтобы с ними бороться, а для удовольствия. И поскольку при этом мы будем использовать математику, удовольствие будет своеобразным и полезным, в отличие от самого результата. Ну а если рассуждения заведут нас слишком далеко, можно взять на вооружение постулат Персига: «Число разумных гипотез, объясняющих любое данное явление, бесконечно». Со всеми этими глубокомысленными фразами и законами мы и станем разбираться, опираясь на язык математики и по возможности строгие выкладки.

Современная математика — огромная страна со сложным «ландшафтом». В ней есть и цветущие долины, и древние памятники, развлекательные центры и пряничные городки, даже супермаркеты с готовыми решениями на все случаи жизни. Все это связано хорошо оборудованными дорогами с указателями и путеводителями. Но есть в математической стране и глухие участки с густыми непроходимыми лесами, горами и топкими болотами, через которые проходят внезапно исчезающие тропинки с шаткими мостиками гипотез и предположений. Наконец, она окружена неизведанными землями, куда если и осмеливался ступить человек, то лишь очень отважный и часто одинокий в своих поисках. Я не случайно так увлекся этой аллегорией. Она гораздо ближе к пониманию того, что такое наука, чем кажется на первый взгляд. Ведь в любом городе можно ходить по-разному от одной площади до другой, от одного здания к другому. Наконец, в любом городе по-разному можно жить.

Выходя на улицы родного города ребенком, вы изучаете правила перехода улиц, назначение тротуаров и магазинов, узнаёте первые надежные тропинки. Если уже взрослым вы впервые попадаете в новый интересный для вас город, то, скорее всего, выберете для ознакомления экскурсионный маршрут, который уже отработан годами и представляет собой своеобразное произведение искусства. Так за какие-нибудь пару часов вы получите яркие впечатления о городе, которые останутся с вами на всю жизнь. Но вы не сможете сказать, что узнали его по-настоящему. Быть может, вас туда занесет по работе — скажем, случится более или менее длинная командировка. Тогда неплохо удастся изучить основные полезные маршруты, и у вас появятся навыки мастерски пользоваться общественным транспортом, перемещаясь быстро, эффективно и удобно. Но и после нескольких недель такой жизни город может остаться незнакомым вам.

Наконец, порой случается так, что город становится вашим по-настоящему. Возможно, вы полюбите его и будете бродить по его улочкам бесцельно, получая удовольствие от самих прогулок. Вы станете отыскивать новые проходы от одной площади к другой через закоулки и дворы, удивительным путем попадать парками и тропинками в нужную точку. Эти дороги могут оказаться на удивление короткими, а способны завести бог знает куда. Но это не страшно: вы знаете этот город и никогда в нем не заблудитесь.

Общий школьный курс похож на освоение элементарных правил жизни в городе. Университетский курс математики уже ближе к экскурсии. Вам покажут главные древние памятники и знаменитые площади, к которым ведут большие проспекты. Глубокое погружение в ту или иную прикладную задачу напоминает командировку: тут не до блужданий, важно четко понять, на какую линию садиться и на какой остановке пересаживаться каждый день, чтобы не терять драгоценных сил и времени. Но с математикой у вас может случиться и настоящая любовь. И тогда вы уже не остаетесь в рамках лишь практической пользы или удобства, вам становится важно понять, почувствовать, что математика как большой город — это не только дома и площади, даже не линии метро и трамвайных маршрутов. Это единая система, соединяющая всё, что в ней есть, не только взаимным расположением, но и смыслами, контекстами, историями.

Эта книга не совсем о математике. Я приглашаю вас на прогулку по некоторым ее местечкам, хорошо известным и имеющим большую практическую пользу. Но двигаться мы будем несколько необычным маршрутом. Не прямым, как в учебнике, и не сложным и запутанным, как в научной работе, а легким, как бесцельное шатание в хорошей компании под интересный разговор. То и дело мы будем оказываться на развилках и площадях с четко обозначенными названиями, соответствующими разделам математики. Оглянувшись, мы отправимся дальше, но читатель может отметить про себя, что пересеченный нами проспект или бульвар — целое направление, куда можно углубиться самостоятельно, будь на то интерес или необходимость.

В стране математики говорят на своем языке, и не все указатели и надписи легко перевести на русский. Иногда я буду приводить цитаты на языке аборигенов. Иначе говоря, в книге есть формулы. Но это вовсе не единственный алфавит языка математики. Формулы можно выразить графически, и я всегда буду сопровождать уравнения иллюстрациями, которые можно понять интуитивно. Почему же я не отказался от формул, как многие авторы научно-популярных книг? В нашей математической стране не принято верить каждому встречному, не принято сильно полагаться на интуицию, чутье и даже на опыт. Да, опыт, в отличие от физики или психологии, здесь имеет сравнительно невысокую цену. В ходу только доказательство — самая твердая валюта, которой неведомы ни девальвация, ни инфляция, ни мода, ни конъюнктура. Она не обесценивается тысячелетиями (и это не фигура речи, мы используем доказательства тысячелетней давности каждый день). Таким образом, все, что я вам здесь наговорю, не должно приниматься на веру. Любое мое утверждение, вывод, даже самый неожиданный, можно проверить строгими доказательствами. Именно поэтому везде, где уместно, есть ключи-заметки в виде формул, которыми я руководствовался. Это, впрочем, не лишает читателя возможности любоваться непонятными значками, воспринимая их как орнамент, а автор оставляет за собой право давать математическим закономерностям не очень серьезные и даже фривольные житейские интерпретации. Ведь так гораздо интереснее!

Глава 1. Знакомимся с неприятностями

Разновидности неприятностей

Какие-то наши неприятности детерминированы: случайности не играют в их возникновении ключевой роли. Например, если вам понизили зарплату на 10 %, а потом извинились и увеличили на 10 %, в итоге этих махинаций вы останетесь в убытке, поскольку:

x(1–0,1)(1 + 0,1) = x(1–0,01) < x.

Более того, если зарплату сначала повысят, а потом, не извинившись даже, понизят на те же 10 %, результат выйдет таким же. Ведь совершенно неважно, в каком порядке перемножаются коэффициенты. Это очень просто, немножко обидно, но к удаче отношения не имеет.

Примером случайной, хоть и весьма вероятной неприятности может быть волшебство, происходящее в наших карманах с наушниками: кладем их аккуратно смотанными в карман, а через полчаса там происходит чудо и вынимаем мы дикий узел проводов. В 2007 году вышла серьезная научная статья двух ученых из солнечного и безмятежного Сан-Диего под заголовком «Спонтанное образование узлов на возбуждаемой нити»[3]. В этой работе детально анализируется и моделируется запутывание наушников в кармане. Авторы, основываясь на теории узлов, теории вероятностей и физических экспериментах, убедительно показывают, что при стандартном способе сматывания наушники действительно должны запутываться, причем спустя всего лишь несколько секунд тряски. Впрочем, это мы и так наблюдаем почти каждый день. Сюрпризом здесь может оказаться только ожидаемая скорость запутывания.

Основной причиной образования узлов оказались, во-первых, петли, которые мы сами создаем, наматывая провод на руку, а во-вторых, три конца наушников: штекер и два динамика. В процессе случайного перемещения по карману они попадают в петли, что само по себе не страшно. Проблема возникает тогда, когда мы, пытаясь наушники распутать, тянем за эти концы. Тут-то и выясняется, что узлы на петле из веревки в трехмерном мире, раз появившись, не могут исчезнуть без нарушения целостности веревки. Пока мы трясем их, не выпуская концы наушников из рук, узлы, образованные этими концами и петлями, никуда не исчезают, а только затягиваются. Причем сами по себе петли ни в чем не виноваты. Если бы концов у наушников не было и они представляли собой замкнутое кольцо, то неразвязываемый узел образоваться бы не смог. Ведь узлы не только не исчезают, раз появившись, но и не возникают сами, если их изначально не было.

С этой неприятностью вполне можно бороться математическим способом: нужно либо исключить концы, что в случае наушников неинтересно, либо убрать петли. А это можно сделать с помощью операции сложения. Но не той, что мы изучали в школе, а той, что применяется к петлям на веревках и лентах. Как и числа, петли бывают разных знаков, причем для каждой «положительной» можно построить такую «отрицательную», что в сумме они дадут «ноль»: прямую веревку. Примеры таких петель показаны на рис. 1.1.


Рис. 1.1. Примеры сложения петель разных знаков

Попробуйте мысленно нанизать на шнурок несколько таких петель разных знаков и вычислите результат и его знак. Чтобы наушники не запутывались, число положительных и отрицательных петель должно оказаться равным. Таких способов сложения проводов несколько, один из них показан на рис. 1.2. Здесь петли разных «знаков» появляются сразу парами и взаимно уничтожают друг друга, не формируя узлов. Уже много лет я складываю наушники именно так, чувствуя себя крутым топологом, и всякий раз радуюсь как фокусу, когда они сами собой полностью разматываются от одного небрежного встряхивания рукой.


Рис. 1.2. Один из способов складывания проводов, не приводящий к их запутыванию. Он хорош еще и тем, что попутно вы складываете пальцы в мудру любви

Но и среди стохастических по природе законов не все одинаково интересны. Например, закон Бука («Ключи всегда находишь в последнем кармане») не имеет рационального основания. Простой подсчет показывает, что при равной вероятности отыскать ключи для всех карманов последний ничем не отличается от прочих. Впрочем, этот закон можно трактовать разве что как забавный трюизм: утверждение Бука верно всегда, поскольку тот карман, в котором ключи будут обнаружены, окажется завершающим в процессе поиска и, следовательно, последним. Однако и здесь есть о чем поговорить. В процессе перебора карманов так называемая условная вероятность того, что ключи лежат в последнем из них, действительно повышается. Но это уже нельзя трактовать как вероятность того, что ключи находятся в последнем кармане, тут уже другая задача. Мы вернемся к этому примеру в главе 5.

Нас будут интересовать законы парадоксальные и поучительные, те, которые выглядят злым роком, выбирающим из множества вариантов самые досадные и неприятные, наперекор интуиции, подсказывающей, что этот вариант не должен быть самым вероятным. И, прежде чем приступить к детальным и точным рассуждениям о случайностях и вероятностях, предположим, что какая-то интуиция в отношении случайных процессов и вероятностей у нас уже есть. Это вполне допустимо даже в математической книге — до какого-то момента использовать интуитивное представление о предмете, а потом дать строгое определение. Тем самым, во-первых, мы определяем границы применимости нашей интуиции, а во-вторых, расширяем их в правильном с научной точки зрения направлении. Но не будем забывать о законе Вертерна: «Предположение — мать любой неразберихи», и все наши гипотезы и даже строгие выводы постараемся, где возможно, проверять с помощью имитационного моделирования.

А при чем тут математика?

Петли, наушники, законы подлости, неприятности… при чем же тут математика? Почему вообще имеет смысл рассуждать о законах подлости не так, как Артур Блох, когда он просто посмеялся и нашел меткий афоризм?

С математикой знакомы все, но мало кто готов ответить на вопрос: что делают математики? Считают и вычисляют? Рисуют треугольники и круги на бумаге в клеточку? Передвигают туда-сюда буквы в уравнениях? Придумывают странные значки и закорючки, чтобы потом писать непонятные тексты? Решают задачи, вычисляя что-то по заказу инженеров, медиков, химиков и других практиков?

Если вы никогда этого не делали, загляните в какой-нибудь математический журнал — просто из любопытства. Сейчас это легко сделать не выходя из дома: поищите в Сети что-то на тему «гомологическая теория типов» или «топология». Вы поразитесь тому, насколько то, что вы там обнаружите, не похоже на школьный образ математики. Но вот что важно: эта колоссальная разница не говорит о том, что есть одна, «простая» математика и другая, «сложная». Математику часто называют языком. Как на любом живом человеческом языке можно писать анекдоты и незамысловатые детские стишки или неуловимо тонкую поэзию, тяжеловесный роман или многостраничный договор, так и с помощью математики можно рассуждать о числах и отрезках, а можно — о петлях и поверхностях, многомерных пространствах и даже основах самой этой науки. Не нужно думать, что числа и отрезки — самое простое, с чем работают математики! Современные теория чисел и геометрия — огромные и во многом неизведанные области, в которых ведутся очень интенсивные исследования.

Но что же все-таки изучают математики? Для чего им этот язык? Чаще всего речь идет о тех или иных моделях. Например, что может быть моделью количества? Число, скажете вы. Но любое ли число годится для этого? Младшие школьники, впервые сталкиваясь с отрицательными числами, испытывают замешательство, ведь модель числа оказывается шире привычного им понятия количества. Переход от количества к шагам помогает понять, что числа годятся для моделирования движений на прямой. Тогда отрицательные числа обретают наконец смысл. А чем можно моделировать скорость? Тоже числом. Но если я скажу вам, что двигаюсь со скоростью 60, будет ли этого достаточно для описания того, что со мной происходит? Точно нет! Остается неясно ни куда я двигаюсь, ни, собственно, с какой скоростью: 60 может означать как 60 км/ч, так и 60 мм/год. Отсюда можно заключить, что для моделирования скорости только числа недостаточно. А если, желая объяснить вам, как я перемещаюсь, я изображу стрелку, станет ли понятнее? Стрелка — ориентированный отрезок — в качестве модели скорости лучше. Она показывает направление, а сравнив ее с какой-то эталонной стрелкой, принятой за единицу, можно определить ее масштаб. Более того, стрелки можно складывать и умножать на числа, получая новые корректные стрелки! И, главное, если мне удастся придумать, как однозначно сопоставлять скорости предметов стрелкам на бумаге, причем окажется, что если v1 соответствует стрелка a, а скорости v2 — стрелка b, сумме скоростей 3v1 + v2 будет соответствовать стрелка 3a + b и никакая иная, — то это уже будет свойством, позволяющим мне не бегать по двору, изучая скорости, а, сидя в кресле, рисовать стрелки на бумаге.

А можно ли чем-то моделировать стрелки? Абстрактной моделью в этом случае способен стать упорядоченный набор чисел с определенными правилами сложения и умножения на число, который называется вектором. Так математики пришли к мысли о линейных векторных пространствах, элементами которых являются векторы. Изучая свойства этих пространств (изучая, а не придумывая, разницу мы обсудим позже), математики выработали единый язык, который называется линейной алгеброй, для разговора о таких разных вещах, как, например, цвета, вращения предметов в пространстве, спектры звуковых сигналов. Пользуясь этим языком, уже можно найти оптимальную стратегию в экономической игре или научить компьютер распознавать нашу речь, рукописные буквы либо лицо человека в толпе.

Математики работают с математическими структурами — универсальными моделями всего, с чем имеет дело человеческий разум. Группы, поля, решетки, графы, петли, косы, языки и бесконечномерные пространства… Все это структуры с четко определенными свойствами и, если угодно, поведением. Вот уже тысячи лет математики исследуют взаимосвязи между ними, обнаруживают в реальном и математическом мире, что еще можно с их помощью моделировать и при каких условиях.

Я не случайно называл манипуляции с петлями на проводе наушников «сложением», а сами петли «положительными» и «отрицательными». Такая терминология оправдана тем, что петли на струне образуют структуру, называемую группой. Для ее построения нужно иметь множество[4] A и некую операцию +, которая будет удовлетворять следующим четырем свойствам.

1. Замкнутость: для любых двух элементов из множества A результат операции + всегда будет элементом этого же множества.

2. Ассоциативность: для любых a, b, c из множества A верно, что (a + b) + c = a + (b + c).

3. Существование нейтрального элемента: в A есть единственный элемент 0, такой, что 0 + a = a + 0 = a для любого a из A.

4. Обратимость: для каждого элемента a в A существует единственный обратный ему элемент (—a), такой, что a + (—a) = 0.

Группа — общая модель для обратимого ассоциативного комбинирования действий или объектов. Ее образуют числа с операцией сложения, и они же формируют группу с операцией умножения. Несложно убедиться, что аксиомам группы удовлетворяют и петли на веревке или ленте. Понятие группы настолько важно в математике, что, хотя они сами нам в этой книге и не понадобятся, нелишним будет о них рассказать тем, кто с таким подходом еще не знаком, или напомнить тем, кто о группах уже слышал, но не связал свою жизнь с их изучением.

Мы в основном будем иметь дело с двумя структурами: случайными величинами и случайными функциями. Но, знакомясь с ними, мы встретим многие другие понятия и модели и обозначим некоторые связи между ними.

А начнем мы с простого инструментария, который будет полезен на протяжении всего рассказа. И для этого нам потребуется… велосипед!

Закон велосипедиста

Я большой энтузиаст любительского велосипедного спорта. Многие задачи, вошедшие в эту книгу, я обмозговывал в седле, вертя их мысленно и так и эдак, пытаясь найти наиболее наглядный и простой подход к их объяснению. Что может быть лучше, чем мчаться по трассе ранним утром, по холодку, скатываясь с легкого склона… Это ощущение стоит того, чтобы ради него преодолевать бесконечные подъемы или сопротивление встречному ветру! Правда, порой кажется, что подъемов больше, чем спусков, а ветер норовит быть встречным, куда ни поверни. В книгах по мерфологии в связи с этим приводится закон велосипедиста:

Независимо от того, куда вы едете, — это в гору и против ветра.

Живу я на Камчатке. В Петропавловске много горок — катаясь по городу, их не миновать. Однако меня должна успокаивать такая мысль: начиная свой путь из дома, я возвращаюсь снова туда, а это значит, что суммарный спуск должен быть равен суммарному подъему. Особенно честным будет маршрут, в котором прямой и обратный пути совпадают.

Представим себе 2-километровую трассу, которая состоит из одной симметричной горки: километр вверх, километр вниз. Вверх по склону я могу достаточно долго ехать со скоростью 10 км/ч, а на спуске стараюсь держать скорость 40 км/ч (я осторожный велосипедист). Исходя из этих условий, на подъем я буду тратить в четыре раза больше времени, чем на спуск, и общая картина получится такой: 4/5 времени путешествия уйдет на тягучий подъем и лишь 1/5 — на приятный спуск. Обидно — 80 % времени прогулки займет сложный участок пути! Этот результат не зависит от длины горок, а определяется лишь соотношением скоростей. Если я выкачусь из нашего холмистого города в сторону океана или в долину реки Авачи, горок почти не будет, но в моем распоряжении остаются встречный и попутный ветер или участки с плохой дорогой, которые также способны отнять значительную часть времени путешествия.

Взглянем на закон велосипедиста несколько иначе. Если я сделаю множество селфи на протяжении своей велопрогулки в случайные моменты, а потом займусь их подсчетом и классификацией, то обнаружу, что большинство картинок показывает мне согбенную фигуру в оранжевом шлеме, упорно ползущую вверх по склону либо сопротивляющуюся встречному ветру. Доля снимков с летящим и сияющим велосипедистом, как на рекламной картинке, увы, составит лишь около 20 %. А что скажет статистика? Если мы выпустим на холмистую трассу большую толпу велосипедистов, подождем немного и понаблюдаем за их плотностью, то увидим, что большая часть спортсменов толпится на трудных участках, а доля безмятежно улыбающихся лиц не так уж и велика!

Измеряем уровень подлости

Давайте, как когда-то в школе, покажем на графике зависимость перемещения велосипедиста от времени при движении по симметричной треугольной горке. Только сделаем всё «по-взрослому», в так называемых собственных масштабах задачи[5]: расстояние станем измерять не в километрах, а в долях общего пути. Так же поступим и со временем путешествия. Первую половину пути велосипедист двигался медленно и долго — 4/5 всего времени, — а вторую преодолел быстро — за 1/5 времени (рис. 1.3).


Рис. 1.3. Диаграмма перемещения велосипедиста в долях от общего пути и времени

Что же нам показывает полученный график? Во-первых, мы можем сравнить скорости на разных участках (наклоны) со средней скоростью, которая соответствует диагональной линии. Во-вторых, становится наглядным соотношение 80/50 — 80 % времени путешествия заняла трудная половина маршрута. Кроме того, из графика можно заключить, что за первую половину расчетного времени путешествия велосипедист успеет преодолеть лишь треть пути. Пока все предельно просто и понятно.

А что, если маршрут велосипедиста усложнится и перестанет быть симметричным? Что, если участков с подъемами и спусками окажется несколько, и все они будут разными по сложности? Можно изобразить путешествие и на этот раз — например, так, как показано на рис. 1.4.


Рис. 1.4. Диаграмма перемещения велосипедиста для более сложного маршрута

Диаграмма хорошо отражает характер пути, но не дает представления об общем соотношении легких и трудных участков; иными словами, она ничего не говорит о распределении скоростей. О том, какой смысл мы вкладываем в слово «распределение», речь пойдет в следующей главе; пока же доверимся интуиции и тому, что мы используем его достаточно часто и порой не вкладываем в него точный математический смысл. Чтобы увидеть это распределение, упорядочим отрезки пути по скорости от самых медленных до самых быстрых, после чего вновь нанесем их на диаграмму (рис. 1.5).


Рис. 1.5. Диаграмма перемещения велосипедиста для распределения скоростей

Мы потеряем при этом информацию о последовательности участков, зато получим обобщающую картину, отражающую то, что можно было бы условно назвать «справедливостью» распределения. Более того, если вместо одного велосипедиста мы взглянем на группу спортсменов, ездящих по этому маршруту в произвольном направлении, то наша диаграмма практически не изменится, разве что несколько сгладится из-за разброса скоростей. Ее смысл останется прежним: она покажет, насколько этот маршрут отклоняется от самого справедливого, на котором время преодоления участка не зависит от его «трудности», а определяется только его длиной.

Пора пояснить, откуда взялась такая странная терминология. С начала XX века у эконометристов, демографов, экологов и маркетологов появились вполне универсальные способы суждения о несправедливости этого мира — кривая Лоренца и связанный с ней индекс Джини.

Для известного распределения в некоторой популяции чего-нибудь ценного, например денег, можно, отсортировав элементы множества по возрастанию уровня богатства, построить кумулятивную кривую. Она строится путем последовательного суммирования вкладов каждого члена группы и показывает, как по мере добавления новых членов растет общее благосостояние популяции. Далее нужно поделить все значения, отмеченные по оси X, на численность популяции, а по оси Y — на общее ее благосостояние, перейдя от конкретных чисел к долям или процентам. Получится кривая, носящая имя американского экономиста Макса Отто Лоренца. Когда мы строили график перемещения велосипедиста по простой треугольной горке, мы, по существу, создали кривую Лоренца для распределения скоростей по отрезкам пути, состоящего всего из двух столбцов, как показано на рис. 1.6.


Рис. 1.6. Распределение скорости велосипедиста по пройденному пути

Конечно, не всякий график перемещения можно воспринимать как кривую Лоренца. Для начала нужно отсортировать периоды путешествия по возрастанию скорости, после чего приступать к построению. Можно построить гистограмму скоростей, сгруппировав известные нам данные по принадлежности к известным интервалам значений, после чего последовательно суммировать вклады всех данных гистограммы, начиная с малых значений и заканчивая самыми большими. Результатом должна стать всюду вогнутая кривая, которая проходит ниже диагонали, — настоящая кривая Лоренца. Упомянутая диагональ называется кривой равенства, она в нашем случае соответствует постоянной (средней) скорости на всем пути или гистограмме с единственным столбиком (такое распределение называется вырожденным). В экономическом контексте кривая равенства отражает всеобщее равенство благосостояния в обществе. Чем больше кривая Лоренца отклоняется от кривой равенства, тем менее «справедливым» можно считать распределение. И, раз уж мы изучаем законы подлости и несправедливости нашего мира, разумно использовать терминологию и инструменты, созданные именно для исследования справедливости.

Площадь под кривой Лоренца для любого невырожденного распределения будет меньше площади под кривой равенства. Их разница может служить формальной характеристикой неравенства или «несправедливости» распределения. Эту роль на себя берет индекс Джини. Он вычисляется как удвоенная площадь замкнутой фигуры, образуемой кривой равенства и кривой Лоренца (ее мы показали заливкой на рис. 1.5), и лежит в диапазоне от 0 до 1. Для кривой равенства, идеального вырожденного мира, индекс Джини равен 0, а в самом кошмарном варианте, когда все богатство группы принадлежит одному ее члену, он равен 1. В рассмотренном нами примере он составляет 0,35. Это неплохой показатель. Скажем, распределение богатства среди населения в России сейчас имеет индекс Джини 0,39, в США — 0,49, в Австрии и Швеции не превышает 0,3, а для всего мира он в 2017 году составил 0,66. Так что приведенная нами в качестве примера ситуация с велосипедистами, конечно, несправедлива, но вполне терпима.

Обратите внимание на то, что с помощью некоторого формального индекса мы стали сопоставлять совершенно разные и несравнимые вещи. Это одновременно и заманчиво, и опасно. Нужно отдавать себе отчет в том, что формальные индексы и числовые показатели всегда чему-то равны, независимо от того, есть в этом какой-либо смысл или нет. Мы сравниваем распределение богатства среди населения стран и распределение времени, затрачиваемого на преодоление пути, с точки зрения отличия от некоторого варианта, который сочли бы справедливым. Пока мы ведем фривольные и подчас хулиганские разговоры о законах подлости, пожалуй, это оправданное сравнение; но в науке так, конечно, делать нельзя. Кривую Лоренца и индекс Джини можно формально рассчитать и для гистограммы яркости пикселов на картинке или для частотности слов в живой речи. Но к справедливости это не будет иметь никакого отношения, да и смысла останется совсем немного, поэтому, имея в виду индекс Джини для чего попало, мы будем его называть индексом подлости, чтобы не вводить читателя в заблуждение наукообразностью терминов.

Кривые Лоренца и индекс подлости позволят нам смело сравнивать возмутительно разные вещи. Математика — точная наука, но никто не запрещает математикам хулиганить. В своем, конечно, кругу и без драк.

От закона велосипедиста к парадоксу инспекции

Вывод, который делает велосипедист, пыхтя на пониженной передаче: «Мир несправедлив, большую часть сил отнимает самая дурацкая часть работы», — часто именуют принципом Парето или принципом «80/20»: «80 % усилий дают 20 % результатов». Это абсолютная эмпирика: принцип Парето никто не доказывал, но его так часто цитируют, что он уже производит впечатление истины. Его используют и как оправдание неудачам, и даже как инструкцию, обнаруживают в самых разных проявлениях. Иногда это работает: например, принципу «80/20» соответствует индекс подлости около 0,6, как для распределения богатства в мире.

У принципа Парето есть полезное для понимания более строгое обобщение. Закон подлости, названный Артуром Блохом в честь безымянного велосипедиста, имеет официальное научное звание: парадокс инспекции. Это хорошо известное явление встречается в разных исследованиях, связанных с социологическими опросами, тестированием, и в теории отказов (разделе прикладной математики, занимающемся надежностью сложных систем), неявно, но систематически смещая наблюдаемые результаты в сторону наиболее часто наблюдаемых явлений.

Приведем классический пример, связанный с неудовольствием пассажиров общественного транспорта. На линии в некоем городе работает множество автобусов. В относительно короткий час пик они переполняются, всё же остальное время ходят почти пустыми. Если мы станем опрашивать пассажиров, то выясним, что большая их доля оказалась невезучей и ехала в переполненном транспорте (по той простой причине, что в переполненном автобусе было больше людей), и получим выражение общего недовольства. Если же мы опросим водителей, то они тоже начнут жаловаться, но, как ни странно, на незаполненность большинства маршрутов и неразумность руководства, гоняющего их попусту. Гибкий график сгладит ситуацию, но в любом случае кривая Лоренца будет отклоняться от кривой равенства, соответствующей невероятной ситуации всегда одинакового числа пассажиров во всех автобусах.

В учебниках по теории вероятностей часто встречается специальный непрозрачный мешок, в который математики складывают разнообразные объекты, а потом наугад вытаскивают их, делая подчас весьма глубокомысленные выводы. Разрешение нашего парадокса в том, что, анализируя систему пассажиропотока в целом, мы кладем в мешок автобусы, а проводя опрос, достаем из него наугад пассажиров и по их данным пытаемся делать выводы об автобусах. Рисунок 1.7 показывает, в чем тут разница.


Рис. 1.7. Статистика по автобусам говорит, что в 75 % машин есть свободные места, то есть они ходят не в полной мере эффективно. А опрос пассажиров обнаружит, что 61 % людей, воспользовавшихся автобусом в этот день, оказались в переполненном транспорте и остались недовольны

Рассмотрим эту ситуацию подробнее, построив кривую Лоренца (на этот раз настоящую) для числа пассажиров в автобусах, показанных на рис. 1.7.

Для этого нужно отсортировать машины по числу пассажиров и последовательно суммировать вклад каждого в общий пассажиропоток.



Поделиться книгой:

На главную
Назад