Полученные кумулятивные суммы следует разделить на их максимальные значения, чтобы получить доли, например, в процентах, после чего их можно нанести на диаграмму (рис. 1.8).
Рис. 1.8. Кривая Лоренца хорошо иллюстрирует несправедливость ситуации с автобусами: половина возит лишь четверть всего пассажиропотока, а на 25 % перегруженных машин приходится половина пассажиров
Кривая Лоренца в данном случае показывает, как распределение числа элементов в некоторых группах (горизонтальная ось) смещается при анализе распределения элементов по принадлежности к группам (вертикальная ось). В этом, собственно, и состоит парадокс инспекции: картинка, которую наблюдает инспектор, оказывается искаженной. Ведь он анализирует не группы, а их элементы, и при этом наблюдаемые значения смещаются в сторону более «весомой» части распределения.
Сам по себе закон велосипедиста очень прост, но он то и дело будет усугублять другие законы подлости, прибавляя им угрюмой эмоциональной окраски. Размышляя об этом, мне нравится представлять, как искажается восприятие мира инспектором, становясь контрастнее. В растровых графических редакторах есть инструмент «Кривые». Он позволяет дизайнеру или фотографу тонко менять контраст картинки, манипулируя распределением числа пикселов по яркости. Вот, например, как меняет восприятие реальности кривая Лоренца, полученная нами для автобусов. Картина мира становится мрачнее, как мы и ожидаем (рис. 1.9).
Рис. 1.9. Кривая Лоренца, примененная в качестве фильтра «Цветовая кривая» в растровом графическом редакторе, делает любую картину мрачнее
Крайнее проявление парадокса инспекции возникает, если в группах, помещенных в наш теоретический мешок, есть не просто редкие элементы, а элементы, не наблюдаемые вовсе. Тогда мы получаем то, что статистики, демографы и публицисты называют
Часто ее демонстрируют на примере с дельфинами, которые спасают людей, оказавшихся волею несчастного случая в открытом море. Дельфины обнаруживают на поверхности моря любопытный несъедобный объект (человека) и играют с ним, подталкивая носом. При этом они необязательно толкают его в сторону ближайшего берега — часть людей они уводят в открытое море, поскольку разумно предположить, что для дельфина берег, да еще и населенный людьми, опасен. Однако, если всё же дельфины толкают потерпевшего именно к берегу, в сторону спасения, и он благодаря этому выживает, весь мир облетает новость: дельфины спасли человека! О поведении дельфинов во всех прочих печальных случаях, увы, мы не узнаем ничего. Эти элементы из мешка мы не достанем и в статистику они не попадут, так что мы получим явно искаженную картину.
Об этом явлении часто рассказывают в различных демотивирующих статьях для начинающих бизнесменов, уверяя их в том, что успешный путь, описываемый в мотивационных книгах, скорее всего, не для них: «неудачники книг не пишут». Впрочем, к законам подлости это отношения не имеет, тут мы касаемся психологии. Парадокс инспектора и ошибка выжившего действительно способны искажать восприятие действительности, омрачая ее либо придавая излишне радужную окраску. Но с научной точки зрения это методические ошибки при получении и обработке данных. К сожалению, они приводят к расхожему мнению о статистике как нечестном манипулировании фактическими данными среди людей, весьма далеких от этих методик. О таких ошибках знать полезно, чтобы избегать их в своей работе и критически относиться к новостям, слухам и недобросовестным исследованиям. Этой теме посвящена относительно недавняя книга Джордана Элленберга «Как не ошибаться»[6], содержащая множество ярких примеров того, как статистические данные и числа могут быть до забавного неверно поданы и интерпретированы.
Мы встретимся с парадоксом инспекции и его влиянием еще не раз: стоя в очереди или на автобусной остановке, рассуждая о судьбе. Поняв, что это не козни рока, а простейшая математика, с которой бороться смысла нет, можно научиться получать удовольствие и от затяжных подъемов, и от нудных, но неизбежных этапов работы — хотя бы решая в уме задачи или медитируя. Даосы стремились жить вечно и верно рассудили, что вместе с работой над телом для достижения их цели требуется подготовка ума. Ведь для вечной жизни нужно не только умение отпускать привязанности, но и терпение, а также способность получать удовольствие от затяжных участков.
Глава 2. Знакомимся со случайностями и вероятностями
Разговор о законах подлости как источнике житейских неурядиц часто начинается со знаменитого закона бутерброда. Он просто формулируется, легко проверяется и широко известен:
Понятно, что «всегда» здесь явное преувеличение: легко представить себе условия, в которых бутерброд упадет, но при этом намазанная маслом сторона останется в сохранности. Что же люди понимают под этим законом? Скорее всего, что бутерброд падает маслом вниз достаточно часто, чтобы это было заметно. Но чаще ли происходит неблагоприятный исход, чем благоприятный? Бутерброды бывают разные, падают при различных обстоятельствах и с разной высоты. Параметров столько, что говорить о закономерностях в такой задаче, возможно, нет смысла. По-всякому бывает. Иногда маслом вниз — тогда становится обидно, мы вспоминаем закон и закрепляем его в памяти. А если бутерброд падает неинтересно — маслом кверху — или кусок хлеба вовсе без масла, и говорить не о чем: понятно же, что закон шуточный!
В принципе бутерброд подобен монетке, которую математики используют для получения случайных величин с двумя возможными значениями: «орел» и «решка». Если монетка «честная», то ей неважно, какой стороной падать. По идее, с бутербродами дела должны обстоять так же.
Мы вернемся к ним и посвятим им целую главу, в которой очень внимательно изучим их падение, но пока присмотримся к самой, наверное, простой вероятностной системе: монетке. Ее в книгах о теории вероятностей подбрасывают каким-то особым магическим образом — так, чтобы выбор начального положения, начальной скорости и скорости закручивания при подбрасывании никак не влиял на вероятность исхода. Но очевидно же, что это невозможно! Монетка представляет собой
Мы с вами, конечно, не роботы и не демоны, а большинство не умеют жонглировать и тремя апельсинами. Но неужели люди подбрасывают монетки настолько неряшливо и непредсказуемо, что законы механики могут приводить к случайностям? Да и откуда вообще берется случайность в мире, описываемом строгими и предсказуемыми законами механики? Существует ли она в реальном мире? Многие мои знакомые, в том числе искушенные в науке, уверены, что
Но в чем же разница между истинно хаотическими или стохастическими системами, принципиально непредсказуемыми, и теми, где трудно угадать поведение, рассчитать которое все же возможно? Когда стоит переходить на язык вероятностей и о чем он позволяет говорить, что невозможно выразить иначе, не прибегая к этому языку?
Что мы имеем в виду, говоря о вероятности?
Начнем разбираться с простенькой монеткой и посмотрим, каким может быть источник неопределенности в эксперименте с подбрасыванием. Задача подробно рассматривалась в 1986 году Джозефом Келлером[7], и здесь мы приведем простое объяснение возникновению неопределенности в этом нехитром процессе, основанное на рассуждениях из его статьи. В самом первом приближении то, какой стороной упадет монета, зависит от времени ее полета
Рис. 2.1. Диаграмма, показывающая четность количества оборотов монеты в полете. Прямоугольником показана область, в которой чаще всего происходит процесс гадания на монетке при подбрасывании рукой
С помощью этой полосатой диаграммы можно выяснить, каким будет результат подбрасывания монетки, закрученной на известное число оборотов в секунду и пойманной через известное время после броска. Если попадаем в белую полоску, выпадет та же сторона, что была сверху при броске; если в серую — обратная. Линии равного числа оборотов представляют собой гиперболы; видно, что по мере увеличения числа оборотов чередование областей становится все более частым, а сами области оказываются тоньше. Человеческая рука несовершенна, и очень небольшой разброс начальных значений перекрывает сразу много областей, делая исход непредсказуемым. В диапазоне действия руки (прямоугольник на диаграмме) смещения на 5 % достаточно для того, чтобы перескочить с белой полоски на серую. Остается вопрос: как из этого построения следует «честность» настоящей монеты? Как из такой диаграммы получить
Чтобы перевести наши рассуждения на язык вероятностей, окунемся в математику, которую не проходят в школе. И хотя от нее ожидают чего-то сложного, сейчас она упростит дело и поможет лучше понять, о чем мы рассуждаем.
Во введении я говорил, что математики изучают не числа или геометрические фигуры, как может показаться после изучения школьного курса. Они работают со сложными структурами (абстрактными алгебрами, полукольцами, полями, моноидами, топологическими пространствами и прочей абстрактной всячиной), описывают их, вроде бы совершенно не привязываясь к практике, корректно определяют, изучают их свойства, доказывают теоремы. А потом они оттачивают мастерство в поиске подобных структур в самых разных явлениях природы и областях человеческих знаний, совершая удивительно полезные прорывы, в том числе в чисто прикладных областях. Сейчас мы рассмотрим, как строится базис теории вероятностей, основанный на достаточно абстрактном понятии
Мы описали механику монетки и получили области, описывающие множества решений с определенными свойствами. Области — плоские фигуры. Как правильно перейти от них к вероятностям? Нужно измерять наши области, и мы естественным путем приходим к их площади. Площадь —
В математике есть целый раздел, который называется
Хотя наша книга не учебник, на этом стоит остановиться, чтобы взглянуть на понятия теории вероятностей как бы с «высоты птичьего полета» и почувствовать вкус «большой» математики. Я прошу читателя не пугаться, если что-то в приводимых ниже определениях покажется непонятным. Если язык математики вам незнаком, воспринимайте это как отрывок текста «в оригинале» на незнакомом вам языке. Он может быть не полностью понятен, но в нем нет искажений «переводчика» и не нарушена целостность. При изучении истории, литературы или иностранных языков необходимо работать или хотя бы знакомиться с оригинальными текстами и полными цитатами. Язык математики тоже требует знакомства с «оригиналом», поскольку в текстах определений и теорем ничего ни прибавить, ни убавить без потерь не получится. Попытки сократить текст «для ясности» порой приводят к серьезным неточностям и вовсе к ошибкам. Итак, вот как звучит определение меры.
Пусть имеется множество
Набор его подмножеств F называется алгеброй, если для F верно:
1) пустое множество принадлежит F: ∅ ∈ F;
2) если множество
3) если
Из этого определения следует, что пересечение множеств
Набор подмножеств F называется сигма-алгеброй, если вместо 3) потребовать более сильное условие: чтобы объединение счетного числа множеств
Из этого определения следует, что и пересечение счетного числа множеств принадлежит F. Иными словами, сигма-алгебра замкнута относительно счетного объединения и пересечения.
Пусть F — алгебра множеств. Функция μ, сопоставляющая любому множеству
1) мера пустого множества равна 0: μ(∅) = 0;
2) для любых непересекающихся множеств
Если же взять F — сигма-алгебру, а во втором условии взять счетное количество непересекающихся множеств, то получится более сильное условие μ(∪
Из определения меры следуют такие свойства:
1) если
2) если
3) для любых
Знакомые каждому примеры мер —
Количество элементов — так называемая считающая мера. Каждому подмножеству
Длина на прямой, площадь на плоскости, объем в пространстве — тоже мера. Во всех случаях условие аддитивности выполняется.
Всякая ли неотрицательная числовая функция может быть мерой? Вовсе нет. Например, возраст ставит человеку в соответствие вполне определенное положительное число. Но он не подходит под определение меры. Предположение о том, что возраст может быть таковой, приводит к забавным парадоксам. Представьте себе кошку, которой пять лет. Естественно, что и правой, и левой половине животного тоже по пять лет, ведь они возникли одновременно. Если бы возраст был мерой, как, например, кошкин вес, то, согласно свойству аддитивности, кошке как сумме ее половинок должно быть уже десять лет. Подобное деление, впрочем, можно продолжить и достичь сколь угодно большого возраста. С другой стороны, мера части не может превосходить меры целого. Иначе говоря, хвост должен быть строго моложе кошки, а шерстинки на хвосте, соответственно, еще моложе. Так мы приходим к выводу, что мельчайшие клетки, из которых состоит пятилетняя кошка, должны были появиться на свет практически только что. Подобные рассуждения можно применить к таким измеримым величинам, как температура или скорость, которые не являются мерами. Два человека бегут не вдвое быстрее одного. По этому поводу в книге Артура Блоха был сформулирован закон новшества.
В свою очередь, импульс (количество движения) или энергия уже обладают свойствами меры. Вес, количество денег, объем знаний, громкость (амплитуда) крика — хоть и не всегда легко измеримы, но тоже могут служить мерой на множестве людей.
Но вернемся к вероятностям. На интуитивном уровне с этим понятием знакомы сейчас практически все. Ее оценивают политологи и журналисты на ток-шоу, ее обсуждают, говоря о глобальном потеплении или завтрашнем дожде, о ней рассказывают анекдоты: «
Широко распространено понимание вероятности как частоты, с которой могут происходить события при многократных испытаниях или наблюдениях. Это представление согласуется с нашим повседневным опытом, но оставляет ряд сложных вопросов. Например, когда байесовский спам-фильтр выдает следующий результат: «Вероятность того, что сообщение
Современная теория вероятностей базируется на понятии вероятностного пространства. Его определение потребует ввести несколько новых терминов.
Множество всех таких событий называют пространством элементарных событий. Ну что же, мы теперь готовы познакомиться с тем, как в математике определяется вероятность.
1)
2)
3) функция
Как видите, вероятность — сигма-аддитивная мера на пространстве элементарных событий, имеющем меру 1. Соответственно, описанные выше свойства меры на языке вероятностей примут следующий вид.
Если из события
Если из события
Для любых
Рассмотрим простейший пример вероятностного пространства. Пусть мы бросаем монету, то есть в нашем эксперименте возможны всего два исхода, и Ω = {О (орел), Р (решка)}. Сигма-алгебра — множество всех подмножеств Ω, и в ней всего четыре элемента: {∅, {О},{Р},{О, Р}}. Она включает невозможное событие — отсутствие какого-либо результата (∅), а также тривиальное — получение какого-либо из возможных результатов {О, Р}, то есть все множество элементарных событий.
Если монета честная, то зададим такую вероятность: P(О) = 50 %, P(Р) = 50 %. Кроме того, P(∅) = 0,P(О, Р) = 100 %. Очевидно, что свойство сигма-аддитивности (которая в данном случае сводится к аддитивности) выполняется. Именно поэтому у нас получилось вероятностное пространство.
Дискретным случайным величинам соответствуют конечные или счетные множества, в них естественной (считающей) мерой оказывается обыкновенный подсчет количества элементов. Соответственно, вероятность в дискретном вероятностном пространстве получают с помощью комбинаторного подсчета вариантов, знакомого каждому студенту или интересующемуся математикой школьнику. Для непрерывных случайных величин вероятность как мера больше похожа на длину или площадь. Точное определение
Для полноценной работы со случайными событиями и вероятностями вводится одно важнейшее понятие, которое нехарактерно для других мер: независимость событий. С ней и связанной с нею условной вероятностью мы познакомимся в главе 4 и разберемся, что же имеет в виду байесовский спам-фильтр. Впрочем, если читателю уже приходилось решать задачи, в которых появляются независимые события (например, выпадение двух «орлов» при двух подбрасываниях монеты), то он знает, что вероятность пересечения для независимых событий вычисляется как произведение их вероятностей.
Если заменить в обсуждаемых определениях и свойствах вероятности сумму на «максимум», а произведение на «минимум», можно построить альтернативную теорию. Она называется
Возможность невероятного
Первое свойство мер: «Мера пустого множества равна нулю», — кажется тривиальным, но оно интересно своей асимметричностью. Если мера подмножества равна нулю, из этого не следует, что оно пусто! Например, линия — это, очевидно, непустое подмножество точек плоскости (и точек в ней бесконечно много), но ее мера на плоскости, то есть площадь, не просто исчезающе мала, а в точности равна нулю. Бывают и более экзотические примеры — канторовы и фрактальные множества, имеющие сложную структуру, содержащие бесконечное число точек, зримо «занимающие» некоторую площадь или объем, но тем не менее имеющие нулевую меру.
С появлением вычислительной техники множества с необычными свойствами сошли со страниц математических книг и журналов в область, понятную широкой публике. Они вызывают интерес не заложенной в них математикой, а своеобразной гармоничностью, красотой и завораживающей глубиной, которой обладают их визуализации. Треугольник Серпинского, множество Мандельброта и тесно связанные с ним множества Жулиа, как и многие другие математические объекты, стали визуальным символом века компьютерной графики, прежде недоступной человеку (рис. 2.2).
Рис. 2.2. Некоторые красивые объекты нулевой меры: линия на плоскости, спорадическое множество Жулиа
Готовя эту иллюстрацию, я нашел замечательное изображение несвязного множества Жулиа на прозрачном фоне с высоким разрешением. Вставив его в векторный редактор, я столкнулся с забавной трудностью: было очень нелегко попасть курсором в это изображение, чтобы выделить его. Оно такое «рыхлое», что вероятность попадания в закрашенную точку на экране была заметно меньше, чем в прозрачный фон. В вероятностном пространстве тоже могут существовать подмножества нулевой меры, но это не означает, что события из этих подмножеств невозможны. С четвертой-пятой попытки я смог выделить изображение, поскольку точки на экране все-таки имеют конечный размер. Но что было бы, попади в мое распоряжение настоящее несвязное множество Жулиа с бесконечным разрешением?
Представьте себе, что вы пользуетесь программным генератором случайных чисел, который выдает произвольное вещественное число от 0 до 1. Какова вероятность выпадения 0? А 1/2 или
Любопытно, но, окажись у нас идеальный генератор случайных чисел с бесконечной точностью, вероятность получить с его помощью какое-либо рациональное число[8] (не какое-то конкретное, а вообще любое) тоже будет равна нулю. Драматизма этому факту придает то обстоятельство, что множество рациональных чисел не просто бесконечно, оно
Если бы пифагорейцам удалось заглянуть в науку будущего, они пришли бы в недоумение, обнаружив, что верные и понятные рациональные числа — как им казалось, единственно возможные, на которых строилась вся их математика, — практически не встречаются на числовой оси! Вот уж точно — закон подлости! И если в быту мы чаще всего встречаем целые числа или несложные дроби, то даже в повседневной физике или геометрии «работает» большое количество иррациональных зависимостей (корни различных степеней) и трансцендентных функций (синусы, логарифмы и т. п.), делающее рациональные и целые решения редкостью. Среди фундаментальных физических констант нет «фундаментально» рациональных чисел. Некоторые из них — такие как скорость света, заряд электрона, постоянные Планка и Больцмана[9] — приняты рациональными или целыми по соглашению. Просто единицы измерения подобраны так, чтобы фиксировать количество значимых цифр в этих константах, поэтому в таблицах такие величины указаны «точно», но эта точность в известном смысле искусственная, принятая для удобства.
Если кто-то терпеливо проведет тысячу экспериментов с монеткой и радостно скажет вам, что у него получилось столько же выпадений «орлов», сколько и «решек», можете смело выразить сомнение или поздравить его с редкой удачей. Хоть бросание монетки — дискретный случайный процесс, по мере накопления статистики мощность вероятностного пространства будет расти, а мера события «
Мы еще вернемся к этим рассуждениям в одной из следующих глав, когда зададимся вопросом о том, насколько каждый из нас может считать себя нормальным.
О коварстве географических карт
Я хочу вернуться к толкованию вероятности и продемонстрировать эквивалентность ее колмогоровского и частотного определений. Мы раскроем загадку одного закона подлости, который не вошел в классические книги по мерфологии, но хорошо известен туристам, геологам и всем, кто пользуется топографическими картами:
Раскроем карту, чтобы найти на ней какой-нибудь объект. Предположим, нас одинаково часто интересуют объекты, расположенные на всех участках карты. Причем не объекты сами по себе как точки. Весь смысл использования карты состоит в обозрении
Рис. 2.3. Серым выделены «нехорошие» участки. Отдельно показан участок с полупроцентной площадью для карты размерами 40×50 см, она имеет размер, слегка превышающий 3 см
Для окрестности в форме квадратика