Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Вероятности и неприятности. Математика повседневной жизни - Сергей Борисович Самойленко на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:


Полученные кумулятивные суммы следует разделить на их максимальные значения, чтобы получить доли, например, в процентах, после чего их можно нанести на диаграмму (рис. 1.8).


Рис. 1.8. Кривая Лоренца хорошо иллюстрирует несправедливость ситуации с автобусами: половина возит лишь четверть всего пассажиропотока, а на 25 % перегруженных машин приходится половина пассажиров

Кривая Лоренца в данном случае показывает, как распределение числа элементов в некоторых группах (горизонтальная ось) смещается при анализе распределения элементов по принадлежности к группам (вертикальная ось). В этом, собственно, и состоит парадокс инспекции: картинка, которую наблюдает инспектор, оказывается искаженной. Ведь он анализирует не группы, а их элементы, и при этом наблюдаемые значения смещаются в сторону более «весомой» части распределения.

Сам по себе закон велосипедиста очень прост, но он то и дело будет усугублять другие законы подлости, прибавляя им угрюмой эмоциональной окраски. Размышляя об этом, мне нравится представлять, как искажается восприятие мира инспектором, становясь контрастнее. В растровых графических редакторах есть инструмент «Кривые». Он позволяет дизайнеру или фотографу тонко менять контраст картинки, манипулируя распределением числа пикселов по яркости. Вот, например, как меняет восприятие реальности кривая Лоренца, полученная нами для автобусов. Картина мира становится мрачнее, как мы и ожидаем (рис. 1.9).


Рис. 1.9. Кривая Лоренца, примененная в качестве фильтра «Цветовая кривая» в растровом графическом редакторе, делает любую картину мрачнее

Крайнее проявление парадокса инспекции возникает, если в группах, помещенных в наш теоретический мешок, есть не просто редкие элементы, а элементы, не наблюдаемые вовсе. Тогда мы получаем то, что статистики, демографы и публицисты называют систематической ошибкой выжившего.

Часто ее демонстрируют на примере с дельфинами, которые спасают людей, оказавшихся волею несчастного случая в открытом море. Дельфины обнаруживают на поверхности моря любопытный несъедобный объект (человека) и играют с ним, подталкивая носом. При этом они необязательно толкают его в сторону ближайшего берега — часть людей они уводят в открытое море, поскольку разумно предположить, что для дельфина берег, да еще и населенный людьми, опасен. Однако, если всё же дельфины толкают потерпевшего именно к берегу, в сторону спасения, и он благодаря этому выживает, весь мир облетает новость: дельфины спасли человека! О поведении дельфинов во всех прочих печальных случаях, увы, мы не узнаем ничего. Эти элементы из мешка мы не достанем и в статистику они не попадут, так что мы получим явно искаженную картину.

Об этом явлении часто рассказывают в различных демотивирующих статьях для начинающих бизнесменов, уверяя их в том, что успешный путь, описываемый в мотивационных книгах, скорее всего, не для них: «неудачники книг не пишут». Впрочем, к законам подлости это отношения не имеет, тут мы касаемся психологии. Парадокс инспектора и ошибка выжившего действительно способны искажать восприятие действительности, омрачая ее либо придавая излишне радужную окраску. Но с научной точки зрения это методические ошибки при получении и обработке данных. К сожалению, они приводят к расхожему мнению о статистике как нечестном манипулировании фактическими данными среди людей, весьма далеких от этих методик. О таких ошибках знать полезно, чтобы избегать их в своей работе и критически относиться к новостям, слухам и недобросовестным исследованиям. Этой теме посвящена относительно недавняя книга Джордана Элленберга «Как не ошибаться»[6], содержащая множество ярких примеров того, как статистические данные и числа могут быть до забавного неверно поданы и интерпретированы.

* * *

Мы встретимся с парадоксом инспекции и его влиянием еще не раз: стоя в очереди или на автобусной остановке, рассуждая о судьбе. Поняв, что это не козни рока, а простейшая математика, с которой бороться смысла нет, можно научиться получать удовольствие и от затяжных подъемов, и от нудных, но неизбежных этапов работы — хотя бы решая в уме задачи или медитируя. Даосы стремились жить вечно и верно рассудили, что вместе с работой над телом для достижения их цели требуется подготовка ума. Ведь для вечной жизни нужно не только умение отпускать привязанности, но и терпение, а также способность получать удовольствие от затяжных участков.

Глава 2. Знакомимся со случайностями и вероятностями

Разговор о законах подлости как источнике житейских неурядиц часто начинается со знаменитого закона бутерброда. Он просто формулируется, легко проверяется и широко известен:

Бутерброд всегда падает маслом вниз.

Понятно, что «всегда» здесь явное преувеличение: легко представить себе условия, в которых бутерброд упадет, но при этом намазанная маслом сторона останется в сохранности. Что же люди понимают под этим законом? Скорее всего, что бутерброд падает маслом вниз достаточно часто, чтобы это было заметно. Но чаще ли происходит неблагоприятный исход, чем благоприятный? Бутерброды бывают разные, падают при различных обстоятельствах и с разной высоты. Параметров столько, что говорить о закономерностях в такой задаче, возможно, нет смысла. По-всякому бывает. Иногда маслом вниз — тогда становится обидно, мы вспоминаем закон и закрепляем его в памяти. А если бутерброд падает неинтересно — маслом кверху — или кусок хлеба вовсе без масла, и говорить не о чем: понятно же, что закон шуточный!

В принципе бутерброд подобен монетке, которую математики используют для получения случайных величин с двумя возможными значениями: «орел» и «решка». Если монетка «честная», то ей неважно, какой стороной падать. По идее, с бутербродами дела должны обстоять так же.

Мы вернемся к ним и посвятим им целую главу, в которой очень внимательно изучим их падение, но пока присмотримся к самой, наверное, простой вероятностной системе: монетке. Ее в книгах о теории вероятностей подбрасывают каким-то особым магическим образом — так, чтобы выбор начального положения, начальной скорости и скорости закручивания при подбрасывании никак не влиял на вероятность исхода. Но очевидно же, что это невозможно! Монетка представляет собой механическую систему и подчиняется законам механики, а они не содержат случайных величин. Будущее в законах движения такого простого тела, как монетка, однозначно определяется его прошлым состоянием. Если монетку будет подбрасывать робот или демон Лапласа — мифическое существо, обладающее полной информацией о координатах и скоростях любой механической системы, — то при неизменных начальных данных будут получаться идентичные результаты. Более того, такому демону можно было бы заказать ту или иную сторону при сколь угодно хитром закручивании монеты. Когда я смотрю выступления цирковых жонглеров, которые невероятно ловко и точно управляются с десятком разнообразных предметов, в голову приходит мысль, что демоны Лапласа существуют и живут среди нас. Вот для кого, кажется, нет никакой случайности: ведь часто акробатические номера выполняются под куполом цирка или на весьма неустойчивой башне из всякой всячины. Случайность в этом случае может обернуться трагедией, так что ее необходимо исключить!

Мы с вами, конечно, не роботы и не демоны, а большинство не умеют жонглировать и тремя апельсинами. Но неужели люди подбрасывают монетки настолько неряшливо и непредсказуемо, что законы механики могут приводить к случайностям? Да и откуда вообще берется случайность в мире, описываемом строгими и предсказуемыми законами механики? Существует ли она в реальном мире? Многие мои знакомые, в том числе искушенные в науке, уверены, что настоящих случайностей не бывает, есть лишь нехватка информации, неточные расчеты, глубинное непонимание человеком механики физического мира. Однако «Бог не играет в кости с Вселенной». Эта фраза, неоднократно повторенная Альбертом Эйнштейном, стала девизом механистической картины мира, которая в XXI веке вынуждена уживаться с квантовой механикой, ее неустранимой, как нам сейчас кажется, стохастичностью (случайностью).

Но в чем же разница между истинно хаотическими или стохастическими системами, принципиально непредсказуемыми, и теми, где трудно угадать поведение, рассчитать которое все же возможно? Когда стоит переходить на язык вероятностей и о чем он позволяет говорить, что невозможно выразить иначе, не прибегая к этому языку?

Что мы имеем в виду, говоря о вероятности?

Начнем разбираться с простенькой монеткой и посмотрим, каким может быть источник неопределенности в эксперименте с подбрасыванием. Задача подробно рассматривалась в 1986 году Джозефом Келлером[7], и здесь мы приведем простое объяснение возникновению неопределенности в этом нехитром процессе, основанное на рассуждениях из его статьи. В самом первом приближении то, какой стороной упадет монета, зависит от времени ее полета t и угловой скорости ω. Если измерять последнюю в оборотах за единицу времени, то число оборотов, совершаемое монетой, выражается предельно просто: n = . Эта зависимость задает линии равного числа оборотов в координатах (t, ω), а они, в свою очередь, ограничивают области, соответствующие четному и нечетному числу оборотов: тому, сменится ли сторона монетки после подбрасывания или нет. Пример такой диаграммы показан на рис. 2.1.


Рис. 2.1. Диаграмма, показывающая четность количества оборотов монеты в полете. Прямоугольником показана область, в которой чаще всего происходит процесс гадания на монетке при подбрасывании рукой

С помощью этой полосатой диаграммы можно выяснить, каким будет результат подбрасывания монетки, закрученной на известное число оборотов в секунду и пойманной через известное время после броска. Если попадаем в белую полоску, выпадет та же сторона, что была сверху при броске; если в серую — обратная. Линии равного числа оборотов представляют собой гиперболы; видно, что по мере увеличения числа оборотов чередование областей становится все более частым, а сами области оказываются тоньше. Человеческая рука несовершенна, и очень небольшой разброс начальных значений перекрывает сразу много областей, делая исход непредсказуемым. В диапазоне действия руки (прямоугольник на диаграмме) смещения на 5 % достаточно для того, чтобы перескочить с белой полоски на серую. Остается вопрос: как из этого построения следует «честность» настоящей монеты? Как из такой диаграммы получить вероятность выпадения орла или решки?

Чтобы перевести наши рассуждения на язык вероятностей, окунемся в математику, которую не проходят в школе. И хотя от нее ожидают чего-то сложного, сейчас она упростит дело и поможет лучше понять, о чем мы рассуждаем.

Во введении я говорил, что математики изучают не числа или геометрические фигуры, как может показаться после изучения школьного курса. Они работают со сложными структурами (абстрактными алгебрами, полукольцами, полями, моноидами, топологическими пространствами и прочей абстрактной всячиной), описывают их, вроде бы совершенно не привязываясь к практике, корректно определяют, изучают их свойства, доказывают теоремы. А потом они оттачивают мастерство в поиске подобных структур в самых разных явлениях природы и областях человеческих знаний, совершая удивительно полезные прорывы, в том числе в чисто прикладных областях. Сейчас мы рассмотрим, как строится базис теории вероятностей, основанный на достаточно абстрактном понятии меры.

Мы описали механику монетки и получили области, описывающие множества решений с определенными свойствами. Области — плоские фигуры. Как правильно перейти от них к вероятностям? Нужно измерять наши области, и мы естественным путем приходим к их площади. Площадь — мера плоской фигуры. Это точный математический термин, обозначающий функцию, которая множеству ставит в соответствие некую неотрицательную числовую величину.

В математике есть целый раздел, который называется теорией меры. Она родилась на рубеже XIX–XX веков (у ее истоков стояли французы Эмиль Борель и Анри Леон Лебег) и открыла математикам широкие возможности для анализа очень сложно устроенных объектов: канторовых и фрактальных множеств. Теория меры легла в основу функционального анализа и современной теории вероятностей. Определение вероятности как меры позволяет увидеть все ее основные свойства как для дискретных, так и для непрерывных множеств.

Хотя наша книга не учебник, на этом стоит остановиться, чтобы взглянуть на понятия теории вероятностей как бы с «высоты птичьего полета» и почувствовать вкус «большой» математики. Я прошу читателя не пугаться, если что-то в приводимых ниже определениях покажется непонятным. Если язык математики вам незнаком, воспринимайте это как отрывок текста «в оригинале» на незнакомом вам языке. Он может быть не полностью понятен, но в нем нет искажений «переводчика» и не нарушена целостность. При изучении истории, литературы или иностранных языков необходимо работать или хотя бы знакомиться с оригинальными текстами и полными цитатами. Язык математики тоже требует знакомства с «оригиналом», поскольку в текстах определений и теорем ничего ни прибавить, ни убавить без потерь не получится. Попытки сократить текст «для ясности» порой приводят к серьезным неточностям и вовсе к ошибкам. Итак, вот как звучит определение меры.

Пусть имеется множество X.

Набор его подмножеств F называется алгеброй, если для F верно:

1) пустое множество принадлежит F: ∅ ∈ F;

2) если множество A ∈ F, то и его дополнение X\A ∈ F;

3) если A и B ∈ F, то их объединение AB ∈ F.

Из этого определения следует, что пересечение множеств A и B принадлежит F, а также то, что объединение или пересечение любого конечного числа множеств принадлежит F. Говорят, что алгебра замкнута относительно конечного объединения и пересечения.

Набор подмножеств F называется сигма-алгеброй, если вместо 3) потребовать более сильное условие: чтобы объединение счетного числа множеств Ai принадлежало F: если Ai ∈ F, то ∪iAi ∈ F.

Из этого определения следует, что и пересечение счетного числа множеств принадлежит F. Иными словами, сигма-алгебра замкнута относительно счетного объединения и пересечения.

Пусть F — алгебра множеств. Функция μ, сопоставляющая любому множеству A∈F какое-нибудь неотрицательное число, называется мерой, если:

1) мера пустого множества равна 0: μ(∅) = 0;

2) для любых непересекающихся множеств A, B ∈ F, то есть AB = ∅, верно μ(AB) = μ(A) + μ(B). Такое свойство называется аддитивностью.

Если же взять F — сигма-алгебру, а во втором условии взять счетное количество непересекающихся множеств, то получится более сильное условие μ(∪iAi) = Σiμ(Ai), которое называется сигма-аддитивностью. Такая мера называется сигма-аддитивной.

Из определения меры следуют такие свойства:

1) если A включается в B, то мера A не больше, чем у B: если AB, то μ(A) ≤ μ(B);

2) если A включается в B, то мера разности множеств равна разности мер: если AB, то μ(B\A) = μ(B) — μ(A);

3) для любых A и B верно μ(AB)= μ(A)+ μ(B) − μ(AB).

Знакомые каждому примеры мер — количества (количество яблок в мешке, например), а также длины, площади, объемы фигур.

Количество элементов — так называемая считающая мера. Каждому подмножеству A поставим в соответствие количество элементов в нем: для конечных A положим μ(A) = |A|, а для бесконечных — μ(A) = ∞.

Длина на прямой, площадь на плоскости, объем в пространстве — тоже мера. Во всех случаях условие аддитивности выполняется.

Всякая ли неотрицательная числовая функция может быть мерой? Вовсе нет. Например, возраст ставит человеку в соответствие вполне определенное положительное число. Но он не подходит под определение меры. Предположение о том, что возраст может быть таковой, приводит к забавным парадоксам. Представьте себе кошку, которой пять лет. Естественно, что и правой, и левой половине животного тоже по пять лет, ведь они возникли одновременно. Если бы возраст был мерой, как, например, кошкин вес, то, согласно свойству аддитивности, кошке как сумме ее половинок должно быть уже десять лет. Подобное деление, впрочем, можно продолжить и достичь сколь угодно большого возраста. С другой стороны, мера части не может превосходить меры целого. Иначе говоря, хвост должен быть строго моложе кошки, а шерстинки на хвосте, соответственно, еще моложе. Так мы приходим к выводу, что мельчайшие клетки, из которых состоит пятилетняя кошка, должны были появиться на свет практически только что. Подобные рассуждения можно применить к таким измеримым величинам, как температура или скорость, которые не являются мерами. Два человека бегут не вдвое быстрее одного. По этому поводу в книге Артура Блоха был сформулирован закон новшества.

Если вы хотите, чтобы команда выиграла прыжки в высоту, найдите одного человека, который может прыгнуть на семь футов, а не семь человек, прыгающих на один фут.

В свою очередь, импульс (количество движения) или энергия уже обладают свойствами меры. Вес, количество денег, объем знаний, громкость (амплитуда) крика — хоть и не всегда легко измеримы, но тоже могут служить мерой на множестве людей.

Но вернемся к вероятностям. На интуитивном уровне с этим понятием знакомы сейчас практически все. Ее оценивают политологи и журналисты на ток-шоу, ее обсуждают, говоря о глобальном потеплении или завтрашнем дожде, о ней рассказывают анекдоты: «Какова вероятность встретить на Тверском бульваре живого динозавра? — Одна вторая: или встречу, или нет».

Широко распространено понимание вероятности как частоты, с которой могут происходить события при многократных испытаниях или наблюдениях. Это представление согласуется с нашим повседневным опытом, но оставляет ряд сложных вопросов. Например, когда байесовский спам-фильтр выдает следующий результат: «Вероятность того, что сообщение „Заработать в интернете может любой! Жми! Узнай как!“ — спам, составляет 82 %», с частотой чего это можно связать? Если протестировать сообщение несколько раз, ничего не изменится; можете переставить слова, но результат останется тем же, а при изменении текста сообщения мы переходим к другой задаче. О какой же вероятности речь? Другой пример. Камчатские сейсмологи каждый год публикуют прогноз сейсмической опасности — вероятности сильного землетрясения в ближайшее время. Однако и здесь неясно, можно ли дать частотное толкование такого прогноза. В главе 6 мы разберемся с этим примером, а сейчас приведем определение вероятности, данное замечательным русским математиком Андреем Николаевичем Колмогоровым в 1930-е. Оно может показаться далеким от интуитивного представления и чересчур сложным. Но интуиция — неважный помощник в рассуждениях на такую абстрактную тему, как вероятность. Сформулированное Колмогоровым определение — надежный и универсальный инструмент, применимый к очень широкому кругу задач. В следующих главах мы будем неоднократно обращаться к нему, вырабатывая правильную интуицию у читателя.

Современная теория вероятностей базируется на понятии вероятностного пространства. Его определение потребует ввести несколько новых терминов.

Элементарное событие — результат какого-либо эксперимента или наблюдения за системой, имеющей случайное поведение. При этом один эксперимент порождает ровно одно событие. Например: «выпадение тройки при бросании игральной кости», «наблюдение интервала в 7 минут между автомобилями в дорожном потоке».

Множество всех таких событий называют пространством элементарных событий. Ну что же, мы теперь готовы познакомиться с тем, как в математике определяется вероятность.

Вероятностным пространством называется тройка, включающая пространство элементарных событий Ω, сигма-алгебру его подмножеств F и функцию P, называемую вероятностью, которая каждому элементу из F ставит в соответствие неотрицательное число, причем:

1) P(∅) = 0;

2) P(Ω) = 1;

3) функция P сигма-аддитивна, то есть вероятность счетного объединения непересекающихся событий равна сумме их вероятностей: P(∪iAi) = ΣiP(Ai).

Как видите, вероятность — сигма-аддитивная мера на пространстве элементарных событий, имеющем меру 1. Соответственно, описанные выше свойства меры на языке вероятностей примут следующий вид.

Если из события A следует событие B, то вероятность A не больше, чем вероятность B: если AB, то P(A) ≤ P(B).

Если из события A следует событие B, то вероятность того, что наступит B, но не наступит A, равна разности вероятностей: если AB, то P(B\A) = P(B) — P(A). В частности, если B = Ω, то получаем формулу для вероятности противоположного события. Если событие, означающее, что событие A не произошло, обозначить  то

Для любых A и B верно P(AB) = P(A) + P(B) − P(AB).

Рассмотрим простейший пример вероятностного пространства. Пусть мы бросаем монету, то есть в нашем эксперименте возможны всего два исхода, и Ω = {О (орел), Р (решка)}. Сигма-алгебра — множество всех подмножеств Ω, и в ней всего четыре элемента: {∅, {О},{Р},{О, Р}}. Она включает невозможное событие — отсутствие какого-либо результата (∅), а также тривиальное — получение какого-либо из возможных результатов {О, Р}, то есть все множество элементарных событий.

Если монета честная, то зададим такую вероятность: P(О) = 50 %, P(Р) = 50 %. Кроме того, P(∅) = 0,P(О, Р) = 100 %. Очевидно, что свойство сигма-аддитивности (которая в данном случае сводится к аддитивности) выполняется. Именно поэтому у нас получилось вероятностное пространство.

Дискретным случайным величинам соответствуют конечные или счетные множества, в них естественной (считающей) мерой оказывается обыкновенный подсчет количества элементов. Соответственно, вероятность в дискретном вероятностном пространстве получают с помощью комбинаторного подсчета вариантов, знакомого каждому студенту или интересующемуся математикой школьнику. Для непрерывных случайных величин вероятность как мера больше похожа на длину или площадь. Точное определение случайной величины мы дадим в следующей главе, пока же положимся на ее интуитивное понимание как величины, которую можно измерить или наблюдать. Но повторные измерения могут привести к иным результатам, заранее не известным.

Для полноценной работы со случайными событиями и вероятностями вводится одно важнейшее понятие, которое нехарактерно для других мер: независимость событий. С ней и связанной с нею условной вероятностью мы познакомимся в главе 4 и разберемся, что же имеет в виду байесовский спам-фильтр. Впрочем, если читателю уже приходилось решать задачи, в которых появляются независимые события (например, выпадение двух «орлов» при двух подбрасываниях монеты), то он знает, что вероятность пересечения для независимых событий вычисляется как произведение их вероятностей.

Если заменить в обсуждаемых определениях и свойствах вероятности сумму на «максимум», а произведение на «минимум», можно построить альтернативную теорию. Она называется теорией возможностей. Это характерный подход для математики в целом. Начинаем с абстрактных рассуждений: числа образуют определенную структуру с операциями сложения и умножения; замечаем, что на ограниченном числовом интервале можно построить такую же числовую структуру, но с другими операциями: минимум и максимум. Строим понятие меры на новой структуре и выясняем, что она открывает новый взгляд на мир! В отличие от теории вероятностей, здесь можно построить две согласованные меры — возможность и необходимость. Это направление, созданное американцем азербайджанского происхождения Лотфи Заде, служит основанием для нечеткой логики и используется в системах автоматического распознавания образов и принятия решений.

Возможность невероятного

Первое свойство мер: «Мера пустого множества равна нулю», — кажется тривиальным, но оно интересно своей асимметричностью. Если мера подмножества равна нулю, из этого не следует, что оно пусто! Например, линия — это, очевидно, непустое подмножество точек плоскости (и точек в ней бесконечно много), но ее мера на плоскости, то есть площадь, не просто исчезающе мала, а в точности равна нулю. Бывают и более экзотические примеры — канторовы и фрактальные множества, имеющие сложную структуру, содержащие бесконечное число точек, зримо «занимающие» некоторую площадь или объем, но тем не менее имеющие нулевую меру.

С появлением вычислительной техники множества с необычными свойствами сошли со страниц математических книг и журналов в область, понятную широкой публике. Они вызывают интерес не заложенной в них математикой, а своеобразной гармоничностью, красотой и завораживающей глубиной, которой обладают их визуализации. Треугольник Серпинского, множество Мандельброта и тесно связанные с ним множества Жулиа, как и многие другие математические объекты, стали визуальным символом века компьютерной графики, прежде недоступной человеку (рис. 2.2).


Рис. 2.2. Некоторые красивые объекты нулевой меры: линия на плоскости, спорадическое множество Жулиа

Готовя эту иллюстрацию, я нашел замечательное изображение несвязного множества Жулиа на прозрачном фоне с высоким разрешением. Вставив его в векторный редактор, я столкнулся с забавной трудностью: было очень нелегко попасть курсором в это изображение, чтобы выделить его. Оно такое «рыхлое», что вероятность попадания в закрашенную точку на экране была заметно меньше, чем в прозрачный фон. В вероятностном пространстве тоже могут существовать подмножества нулевой меры, но это не означает, что события из этих подмножеств невозможны. С четвертой-пятой попытки я смог выделить изображение, поскольку точки на экране все-таки имеют конечный размер. Но что было бы, попади в мое распоряжение настоящее несвязное множество Жулиа с бесконечным разрешением?

Представьте себе, что вы пользуетесь программным генератором случайных чисел, который выдает произвольное вещественное число от 0 до 1. Какова вероятность выпадения 0? А 1/2 или e/π? Во всех этих случаях ответ — ноль! Вернее, самое маленькое доступное компьютеру положительное число, так называемый машинный эпсилон, ведь машина оперирует конечным числом знаков после запятой. «Подождите, — скажете вы, — в каком смысле ноль? Эти же числа не невозможные». Проведем эксперимент. В результате мы получим какое-то конкретное число. Тогда «по построению» вероятность его появления не может быть нулевой. Все верно, но прежде чем выпадет конкретное число, нам придется перебрать бесконечное число случайных чисел! Дело в том, что отдельное число, как точка на отрезке, имеет нулевую меру и честную нулевую вероятность. Отлична от нуля лишь мера сплошного отрезка, пусть даже очень маленького. Именно поэтому мы говорим не о вероятности получить некоторое значение случайной величины, а о плотности вероятности, которая при умножении на конечную меру подмножества в вероятностном пространстве даст конечную величину — вероятность попасть в это подмножество.

Любопытно, но, окажись у нас идеальный генератор случайных чисел с бесконечной точностью, вероятность получить с его помощью какое-либо рациональное число[8] (не какое-то конкретное, а вообще любое) тоже будет равна нулю. Драматизма этому факту придает то обстоятельство, что множество рациональных чисел не просто бесконечно, оно всюду плотно. Это значит, что в любой сколь угодно малой окрестности выбранной рациональной точки можно обнаруживать новые и новые рациональные точки. Если мы захотим изобразить это множество графически на числовой оси, то можем брать карандаш и смело рисовать сплошную прямую на ней. Однако и это множество имеет нулевую меру на множестве всех вещественных чисел! Доказательство того, что рациональные числа образуют плотное подмножество нулевой меры множества вещественных чисел, наделало шума в конце XIX века. В таких случаях математики говорят: случайно выбранное вещественное число почти наверняка будет иррациональным. Как бы странно ни звучало, но «почти наверняка» — точный математический термин, означающий, что событие — дополнение подмножества вероятностного пространства нулевой меры.

Если бы пифагорейцам удалось заглянуть в науку будущего, они пришли бы в недоумение, обнаружив, что верные и понятные рациональные числа — как им казалось, единственно возможные, на которых строилась вся их математика, — практически не встречаются на числовой оси! Вот уж точно — закон подлости! И если в быту мы чаще всего встречаем целые числа или несложные дроби, то даже в повседневной физике или геометрии «работает» большое количество иррациональных зависимостей (корни различных степеней) и трансцендентных функций (синусы, логарифмы и т. п.), делающее рациональные и целые решения редкостью. Среди фундаментальных физических констант нет «фундаментально» рациональных чисел. Некоторые из них — такие как скорость света, заряд электрона, постоянные Планка и Больцмана[9] — приняты рациональными или целыми по соглашению. Просто единицы измерения подобраны так, чтобы фиксировать количество значимых цифр в этих константах, поэтому в таблицах такие величины указаны «точно», но эта точность в известном смысле искусственная, принятая для удобства.

Если кто-то терпеливо проведет тысячу экспериментов с монеткой и радостно скажет вам, что у него получилось столько же выпадений «орлов», сколько и «решек», можете смело выразить сомнение или поздравить его с редкой удачей. Хоть бросание монетки — дискретный случайный процесс, по мере накопления статистики мощность вероятностного пространства будет расти, а мера события «число „орлов“ совпадает с числом „решек“» станет уменьшаться. Можно показать, что вероятность этого «самого вероятного» события уменьшается с ростом числа испытаний как . Для сотни бросаний это около 8 %, для десяти тысяч — в десять раз меньше.

Мы еще вернемся к этим рассуждениям в одной из следующих глав, когда зададимся вопросом о том, насколько каждый из нас может считать себя нормальным.

О коварстве географических карт

Я хочу вернуться к толкованию вероятности и продемонстрировать эквивалентность ее колмогоровского и частотного определений. Мы раскроем загадку одного закона подлости, который не вошел в классические книги по мерфологии, но хорошо известен туристам, геологам и всем, кто пользуется топографическими картами:

То место, куда направляется турист, чаще всего оказывается либо на сгибе карты, либо на краю листа.

Раскроем карту, чтобы найти на ней какой-нибудь объект. Предположим, нас одинаково часто интересуют объекты, расположенные на всех участках карты. Причем не объекты сами по себе как точки. Весь смысл использования карты состоит в обозрении окрестностей объекта, некой конечной площади. Пусть нам достаточно будет некоторой малой доли α от площади карты S, чтобы понять, как попасть туда, куда нужно. Если то, что мы ищем, окажется недалеко от сгиба или края карты, скажем ближе какого-то критического расстояния d, мы можем счесть, что закон туриста сработал. Доля таких пограничных площадей в общей площади карты даст нам вероятность испытать этот закон подлости на себе. Вот как выглядят неприятные участки карты при α = 0,5 % и всего одном сгибе (рис. 2.3).


Рис. 2.3. Серым выделены «нехорошие» участки. Отдельно показан участок с полупроцентной площадью для карты размерами 40×50 см, она имеет размер, слегка превышающий 3 см

Для окрестности в форме квадратика  Неприятные полоски будут иметь площадь  Четыре полосы: две вертикальные и две горизонтальные — расположатся у края; любой дополнительный изгиб, горизонтальный или вертикальный, добавит еще одну полоску. А теперь воспользуемся свойством аддитивности мер и вычислим меру объединения всех полосок как сумму их площадей, за вычетом площади пересечений. При этом следует заметить, что пересекающиеся полоски формируют квадратики площадью d2 = αS.



Поделиться книгой:

На главную
Назад