Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Голая статистика - Чарльз Уилан на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:

Для определения рейтингов USNWR используются шестнадцать показателей, с помощью которых оцениваются и распределяются в рейтинге по местам американские колледжи, университеты и профессиональные учебные заведения. Например, в рейтинге национальных университетов и гуманитарных колледжей за 2010 год на долю такого показателя, как «избирательный подход к приему в учебное заведение», приходилось 15 % этого индекса; данный показатель, в свою очередь, вычислялся на основе нормы приема для той или иной школы, доли поступивших студентов, которые в выпускном классе своей школы входили в «лучшие 10 %», а также средних баллов SAT[16] и ACT[17] поступивших студентов. Преимущество рейтингов USNWR заключается в том, что они позволяют простым и доступным способом получить исчерпывающую информацию о тысячах учебных заведений. Даже критики вынуждены согласиться с тем, что большой объем информации об американских колледжах и университетах представляет немалую ценность. Потенциальные студенты должны знать о месте того или иного учебного заведения в рейтинге и средней величине учебной группы.

Разумеется, предоставление значимой информации имеет мало общего с ее объединением в общий индекс, который претендует на авторитетность. По мнению критиков, такие рейтинги неуклюже сконструированы, способны вводить в заблуждение и вредить долгосрочным интересам студентов. «Проблема в том, что это – не более чем перечень, в котором каждому учебному заведению присвоен определенный порядковый номер. Данные, на основе которых он определяется, не обеспечивают требуемой точности», – говорит Майкл Макферсон, бывший президент Макалистерского колледжа в Миннесоте{21}. Почему на долю пожертвований выпускников в пользу своего бывшего учебного заведения приходится 5 % его рейтинга? И если этот показатель так важен, то почему на его долю не приходится, например, 10 %?

Согласно U.S. News & World Report, «каждому показателю на основе наших собственных представлений о его важности присваивается определенный весовой коэффициент (выраженный в процентах)»{22}. Представления – это что-то одно, а произвол и субъективизм – нечто другое. Показателем, имеющим в рейтинге национальных университетов и гуманитарных колледжей самый большой вес, является «научная репутация». Она определяется исходя из «опроса представителей научного сообщества» (анкету заполняют администраторы других колледжей и университетов) и опроса консультантов-психологов, работающих в школах. Критикуя рейтинги, публикуемые U.S. News & World Report, Малкольм Гладуэлл в пух и прах разносит (правда, с изрядной долей юмора) методологию «опроса представителей научного сообщества». Он цитирует опросник, разосланный бывшим председателем Верховного суда штата Мичиган примерно сотне юристов, в сопроводительном письме к которому тот просит юристов расположить десять юридических учебных заведений в порядке убывания их качества. Одним из таких вузов в списке был указан Пенсильванский университет: юристы поместили его примерно в середину перечня. Фишка в том, что на тот момент Пенсильванский университет не имел юридического факультета{23}.

Какими бы обширными ни были собранные данные, вовсе не факт, что рейтинги USNWR измеряют именно то, что должно интересовать потенциальных студентов: какой объем знаний можно получить в том или ином учебном заведении. Футбольные болельщики могут спорить по поводу показателей, входящих в состав индекса распасовщика, но никто из них не станет отрицать того, что составные части этого индекса – коэффициент удачного завершения, среднее число ярдов на каждую попытку паса, процент тачдаун-пасов на каждую попытку паса и коэффициент перехватов мяча – важная составляющая эффективности действий куортербека. Это вовсе не обязательно относится к критериям USNWR, большинство из которых фокусируется на исходных данных (например, какого рода учащихся принимают в учебное заведение, каков уровень оплаты преподавателей, какой процент штатных преподавателей), а не образовательных результатах. Двумя важными исключениями являются процент студентов первого курса, продолживших обучение, и процент выпускников, но даже они не позволяют оценить объем знаний, полученных студентом за время учебы. Как указывает Майкл Макферсон: «В действительности из рейтингов U.S. News & World Report невозможно понять, насколько за четыре года учебы в колледже или университете студенты фактически увеличили свои знания или развили способности».

Все это было бы довольно безобидным занятием, если бы его инициаторы не поощряли действия, не всегда направленные на благо учащихся и учебных заведений. Например, одним из статистических показателей, используемых для вычисления рейтингов, является величина финансовых ресурсов, выделяемых на обучение одного студента; проблема в данном случае – в отсутствии показателя, позволяющего оценить эффективность использования этих финансов. Учебное заведение, меньше расходующее средств в расчете на одного студента, автоматически ухудшает свой рейтинг даже в случае, если эти средства распределяются гораздо эффективнее, чем в других колледжах или университетах. Кроме того, колледжи и университеты заинтересованы в подаче документов как можно большим количеством абитуриентов – в том числе и теми, у кого практически нет шансов пройти по конкурсу, – поскольку высокий конкурс при поступлении также свидетельствует о престижности учебного заведения. Это оборачивается напрасной тратой ресурсов учебными заведениями и бесполезными затратами времени теми абитуриентами, которые изначально не имели никаких шансов на поступление.

Поскольку мы уже почти добрались до главы о вероятности, я готов биться об заклад, что с высокой вероятностью в обозримом будущем рейтинги, публикуемые U.S. News & World Report, по-прежнему будут пользоваться популярностью. Как сказал Леон Ботстейн, президент колледжа Bard College: «Люди предпочитают получать простые и легкие ответы. Какое место самое лучшее? Конечно же, первое»{24}.

Вывод, который можно сделать по прочтении этой главы, что «статистические преступления» не являются следствием математических ошибок. Скорее, наоборот: заумные математические расчеты подчас способны скрыть неблаговидные намерения. То, что вы правильно подсчитали среднее значение, не отменяет тот факт, что медиана представляет собой более точный индикатор. Здравое суждение и честный подход к делу оказываются более важными условиями для выяснения истины. Глубокое знание статистики не мешает нечистым на руку людям манипулировать данными точно так же, как хорошее знание уголовного кодекса не мешает преступникам заниматься своими темными делишками. И в том и в другом случаях «плохие парни» зачастую очень хорошо понимают, что они делают!

4. Корреляция

Откуда Netflix известно, какие фильмы мне нравятся?

Netflix[18] утверждает, что мне точно понравится документальный фильм Bhutto, рассказывающий о жизни и трагической смерти бывшего пакистанского премьер-министра Беназир Бхутто. Возможно, мне действительно понравится этот фильм (я уже добавил его в список кинолент, которые собираюсь посмотреть). Прошлые рекомендации были просто потрясающими. К тому же когда Netflix советовала что-то из того, что я уже видел, то, как правило, фильм был из тех, которыми я действительно наслаждался.

Каким образом Netflix проделывает свои «фокусы»? Может быть, в штаб-квартире компании работает большое число стажеров, которые с помощью Google и опроса членов моей семьи и друзей «вычислили», что меня может заинтересовать документальный фильм о бывшем пакистанском премьер-министре? Конечно нет. Просто Netflix мастерски, со знанием дела использовала статистические данные. Netflix не знакома со мной. Но ей известно, какие фильмы мне понравились в прошлом (поскольку я выставлял им рейтинги). Воспользовавшись этой информацией наряду с рейтингами других кинозрителей и мощным компьютером, Netflix сумела сделать на удивление точные прогнозы относительно моих вкусов и предпочтений.

Я еще вернусь к алгоритму, который применила Netflix при составлении таких прогнозов, пока же достаточно будет сказать, что они основаны на корреляции. Netflix рекомендует фильмы, похожие на те, которые мне когда-то понравились или получили высокие оценки от других кинозрителей, чьи рейтинги подобны моим. Фильм Bhutto мне посоветовали потому, что в свое время я присвоил пятизвездочные рейтинги двум другим документальным фильмам: Enron: The Smartest Guys in the Room и Fog of War.

Корреляция измеряет степень связи между двумя явлениями. Например, существует корреляция между летними температурами и продажей мороженого. Когда повышается температура, растут объемы продажи мороженого. Две переменные положительно коррелированы, если изменение одной переменной вызывает изменение другой в том же направлении, то есть в направлении увеличения или уменьшения (например, взаимосвязь между ростом и весом человека). У более высоких людей больший вес (в среднем); низкорослые люди весят меньше. Корреляция отрицательна, если положительное изменение одной переменной обусловливает отрицательное изменение другой (например, связь между регулярным выполнением физических упражнений и весом человека).

В зависимостях такого рода интересно то, что не каждое наблюдение вписывается в соответствующую схему. Иногда низкорослые люди весят больше, чем высокие. Иногда те, кто вообще не занимается спортом, бывают гораздо стройнее, чем те, кто регулярно выполняет физические упражнения. Тем не менее существует отчетливо выраженная связь между ростом и весом человека, а также между весом и физическими нагрузками.

Если построить диаграмму разброса данных, отражающих рост и вес произвольной выборки взрослых американцев, то получится примерно такая картина:


Если бы нам нужно было построить диаграмму разброса для данных о выполнении физических упражнений (количество минут, затрачиваемых на них каждую неделю) и данных о весе человека, то можно было бы ожидать отрицательной корреляции, причем те, кто занимается спортом больше времени, будут весить меньше. Однако картина в виде совокупности точек, разбросанных по определенной площади, представляет собой несколько неуклюжий инструмент. (Если бы Netflix попыталась предлагать мне какие-то фильмы, продемонстрировав диаграмму разброса рейтингов для тысяч кинолент, выставленных миллионами кинозрителей, то я посчитал бы такую рекомендацию просто неудачной шуткой.) Эффективность корреляции как статистического инструмента заключается в том, что мы можем выразить связь между двумя переменными с помощью одной описательной статистики – коэффициента корреляции.

Коэффициент корреляции обладает двумя чрезвычайно привлекательными характеристиками. Во-первых, в силу причин математического характера, которые мы обсудим в приложении, он представляет собой число в диапазоне от −1 до 1. Корреляция, равная 1 (иногда ее называют идеальной корреляцией), означает, что каждому изменению одной переменной соответствует эквивалентное изменение другой переменной в том же направлении.

Корреляция, равная –1 (иногда ее называют идеальной отрицательной корреляцией), означает, что каждому изменению одной переменной соответствует эквивалентное изменение другой переменной в противоположном направлении.

Чем ближе корреляция к 1 или –1, тем сильнее связь между переменными. Нулевая (или близкая к 0) корреляция говорит об отсутствии значимой связи между двумя переменными (например между результатом экзамена по математике и размером обуви экзаменуемого).

Второй привлекательной особенностью коэффициента корреляции является то, что с ним не связаны никакие единицы измерения. Мы можем рассчитать корреляцию между ростом и весом, несмотря на то что рост измеряется в дюймах, а вес – в фунтах. Мы можем даже вычислить корреляцию между количеством телевизоров, имеющихся дома у учеников, и результатами их экзаменов по математике (я почему-то уверен, что она окажется положительной). (Несколько ниже я остановлюсь подробнее на данной связи.) Коэффициент корреляции буквально творит чудеса: он сжимает сложное сочетание данных, измеряемых в разных единицах (наподобие наших диаграмм разброса роста и веса), в единственную элегантную описательную статистику.

Как это удается?

Как обычно, я привожу самую распространенную формулу для определения коэффициента корреляции в приложении, находящемся в конце этой главы. Это не та статистика, которую можно вычислить вручную. (После того как вы введете соответствующие данные, базовый программный пакет, например Microsoft Excel, рассчитает корреляцию между двумя соответствующими переменными.) Тем не менее на интуитивном уровне понять эту формулу несложно. Формула для вычисления коэффициента корреляции выполняет следующие операции:

1. Вычисляет среднее значение и стандатное (среднеквадратическое) отклонение для обеих переменных. Если вернуться к примеру с ростом и весом, то мы бы узнали средний рост людей в выборке, средний вес людей в той же выборке и стандартное отклонение для роста и веса.

2. Преобразует все данные таким образом, чтобы каждое наблюдение было представлено его расстоянием (в стандартных отклонениях) от среднего значения. Верьте мне, это совсем не сложно. Допустим, средний рост в выборке равняется 66 дюймам (при стандартном отклонении в 5 дюймов), а средний вес – 177 фунтов (при стандартном отклонении в 10 фунтов). Теперь предположим, что ваш рост – 72 дюйма, а вес – 168 фунтов. Мы можем также сказать, что ваш рост составляет 1,2 стандартного отклонения сверх среднего роста [(72 ‒ 66)/5) = 1,2] и 0,9 стандартного отклонения ниже среднего веса, или –0,9 применительно к нашей формуле [(168 ‒ 177)/10 = –0,9]. Да, это нетипично, когда рост человека выше среднего, а вес – ниже среднего, но поскольку вы уже заплатили неплохие деньги за эту книгу, то, как мне кажется, я должен в знак благодарности сделать вас высоким худощавым человеком. Обратите внимание: ваш рост и вес, выражавшиеся поначалу в дюймах и фунтах, теперь выражаются абстрактными числами 1,2 и – 0,9. Как видите, потребность в единицах измерения отпала.

3. Теперь я могу скрестить руки на груди и предоставить возможность компьютеру выполнить остальную работу. Формула вычисляет связь по всей выборке между ростом и весом, которые измеряются в стандартных единицах. Когда рост отдельных людей в выборке равняется, к примеру, 1,5 или 2 стандартного отклонения выше среднего значения, какими должны быть значения их веса, измеренные в стандартных отклонениях от среднего значения для веса? А когда рост членов выборки близок к среднему значению, какими будут значения их веса, измеренные в стандартных единицах?

Если расстояние от среднего значения для одной переменной в целом соответствует – по величине и направлению – расстоянию от среднего значения для другой переменной (например, для людей, рост которых существенно отличается в ту или другую сторону от среднего значения роста, значения их веса, как правило, существенно отличаются от среднего значения веса, причем в том же направлении, что и рост), то у нас есть основания говорить о сильной положительной корреляции.

Если же расстояние от среднего значения для одной переменной в целом соответствует аналогичному расстоянию от среднего значения для другой переменной, но в противоположном направлении (например, у людей, которые чаще среднего занимаются физическими упражнениями, как правило, вес гораздо ниже среднего), то у нас есть основания говорить о сильной отрицательной корреляции.

Если две переменные в целом не отклоняются от среднего значения сколь-нибудь существенно (например, размер обуви и интенсивность занятий физическими упражнениями), то мы можем говорить о незначительной или нулевой корреляции.

Я чувствую, вы перенапряглись, читая этот раздел. Хочу вас утешить: вскоре мы вернемся к Netflix и тому, как ей удается угадывать ваш интерес к тем или иным фильмам. Однако вначале поразмышляем над еще одним событием, где корреляция играет немаловажную роль, – SAT. Да, именно SAT, о котором говорилось в главе 3. Этот тест (первоначальное название – Scholastic Aptitude Test) представляет собой стандартизированный экзамен, состоящий из трех разделов: математика, чтение и письмо. Возможно, вам уже приходилось его сдавать (или придется сдавать в будущем). Не исключено, что вы особо не задумывались над тем, почему вам нужно его сдавать. Цель этого экзамена – оценить вашу способность к обучению и спрогнозировать вашу успеваемость в колледже или университете. Разумеется, у вас (и особенно у тех из вас, кому не нравятся стандартизированные тесты) может возникнуть резонный вопрос: уж не для этого ли предназначена средняя школа? Почему так важен какой-то там четырехчасовой тест, если члены приемной комиссии колледжа могли бы просто ознакомиться с оценками, которые вы получали на протяжении четырех лет учебы в старших классах школы?

Ответ на этот вопрос содержится в материале, с которым вы знакомились в главе 1 и 2. Оценки, которые выставляются ученикам в школе, представляют собой несовершенную описательную статистику. Ученик, получающий посредственные оценки при прохождении напряженной школьной программы для специализированных классов по математике и другим естественным наукам, может иметь большие академические способности и потенциал, чем ученик той же школы, предпочевший программу с гуманитарным направлением. Это объясняется тем, что гуманитарные предметы усваиваются, как правило, гораздо легче, и получить высокие оценки по ним не составляет особого труда. Очевидно, что между разными школами также существуют немалые различия, которые сказываются на оценках учеников. Согласно данным College Board (орган, который разрабатывает и управляет SAT), этот тест призван «демократизировать доступ к высшим учебным заведениям для всех учащихся». Что можно возразить против такого довода? Все справедливо! SAT предлагает стандартизированный показатель способностей, который позволяет сравнивать всех абитуриентов, поступающих в колледжи и университеты. Но можно ли считать его достаточно надежным показателем способностей? Если мы хотим показатель, который позволяет легко сравнивать способности учащихся, то мы могли бы также предложить всем выпускникам школы посоревноваться в забеге на 100 ярдов, что было бы гораздо дешевле и проще, чем администрировать SAT. Проблема, конечно же, в том, что результат, показанный в забеге, никоим образом не коррелирован с академической успеваемостью в колледжах и университетах. Данные о результатах забега получить легко, однако они не имеют ничего общего с интересующим нас вопросом.

Чем же SAT лучше в этом отношении? К большому разочарованию будущих поколений старшеклассников, SAT вполне достойно справляется с задачей прогнозирования успехов студентов-первокурсников, так что сдавать его придется. College Board публикует соответствующие показатели корреляции. На шкале от 0 (полное отсутствие корреляции) до 1 (идеальная корреляция) корреляция между средней оценкой ученика старших классов школы и средней оценкой студента-первокурсника равняется 0,56. (Чтобы было понятнее, что это означает, скажу, что корреляция между ростом и весом взрослых мужчин в Соединенных Штатах составляет примерно 0,4.) Корреляция между комплексным результатом, показанным при сдаче SAT (чтение, математика и письмо), и средним баллом студента-первокурсника также 0,56{25}. Это вроде бы говорит в пользу отказа от SAT, поскольку этот тест способен предсказать академическую успеваемость будущих студентов колледжей и университетов ничуть не лучше, чем средняя оценка ученика старших классов. По сути, самым надежным показателем будет комбинация баллов, полученных при сдаче SAT, и средней оценки ученика старших классов: корреляция между таким сочетанием и средним баллом студента-первокурсника составляет 0,64. Да, это действительно так.

Важным моментом в этом обсуждении является то, что корреляция не предполагает причинно-следственной связи: положительная или отрицательная корреляция между двумя переменными вовсе не обязательно означает, что изменения одной переменной вызывают изменения другой. Например, выше я указывал на вероятную положительную корреляцию между суммой баллов, полученных учащимся при сдаче SAT, и количеством телевизоров у него дома. Но это не значит, что родители могут существенно повысить результаты тестов своих детей путем покупки еще пяти телевизоров. Не говорит это, по-видимому, и о том, что сидение перед телевизором благотворно сказывается на академической успеваемости ученика.

Самым логичным объяснением такой корреляции может быть то, что высокообразованные родители могут себе позволить покупку нескольких телевизоров, что, однако, не мешает их детям сдавать экзамены с результатами, превышающими средний балл. Как количество телевизоров, так и экзаменационные оценки, по-видимому, обусловлены некой третьей переменной, коей является уровень образования родителей. Я не могу доказать наличие корреляции между количеством телевизоров в семье и количеством баллов, полученных при сдаче SAT (College Board не публикует соответствующих данных). Но готов доказать, что ученики из состоятельных семей демонстрируют в среднем более высокие результаты сдачи SAT, чем ученики из менее обеспеченных семей. Согласно данным, опубликованным College Board, учащиеся из семей с годовым доходом, превышающим 200 000 долларов, в среднем получают при сдаче математического раздела SAT 586 баллов, тогда как учащиеся из семей с годовым доходом, равным или меньшим 20 000 долларов, в среднем получают при сдаче того же математического раздела SAT лишь 460 баллов{26}. Между тем, вполне вероятно и то, что в домах семей с годовым доходом, превышающим 200 000 долларов, больше телевизоров, чем в домах семей с годовым доходом менее 20 000 долларов.

Я начал писать эту главу несколько дней назад. За это время у меня появилась возможность посмотреть фильм Bhutto. Он действительно замечательный. Полная версия фильма, в которой охватывается период с момента отделения Пакистана от Индии в 1947 году до убийства пакистанского премьер-министра Беназир Бхутто в 2007-м, производит сильное впечатление. Голос Бхутто искусно вплетается в сюжетную линию в форме выступлений и интервью. Как бы то ни было, я пометил эту киноленту пятью звездочками, что вполне соответствует прогнозу Netflix.

В своей деятельности компания Netflix использует концепцию корреляции. Все началось с того, что я выставил оценки ряду фильмов. Netflix сравнила их с рейтингами других кинозрителей, чтобы выявить тех, чьи рейтинги высоко коррелированы с моими. Этим кинозрителям, как правило, нравятся те же фильмы, что и мне. Установив данный факт, Netflix может рекомендовать мне фильмы, которые понравились моим единомышленникам и которых я еще не видел.

Это, так сказать, «картина в целом». Фактическая методология гораздо сложнее. Вообще говоря, в 2006 году Netflix инициировала конкурс, в рамках которого обычным гражданам было предложено разработать механизм, который бы повысил эффективность уже существующих рекомендаций Netflix по меньшей мере на 10 % (это означает, что данная система стала бы на 10 % точнее при прогнозировании того, как бы кинозритель оценил тот или иной фильм после просмотра). Победителю был обещан 1 миллион долларов.

Каждый человек или группа людей, зарегистрировавшихся для участия в конкурсе, получал «обучающие данные», состоящие из более чем 100 миллионов рейтингов, выставленных 18 000 фильмам клиентами Netflix (их общее количество составляло 480 000 человек). Отдельная совокупность из 2,8 миллиона рейтингов не разглашалась (то есть Netflix знала, как кинозрители оценили эти фильмы, но участникам конкурса такая информация не предоставлялась). Конкурсантов оценивали по тому, насколько успешно предложенные ими алгоритмы прогнозировали фактические оценки, выставленные зрителями этих «неразглашенных» фильмов. Спустя три года тысячи команд из более чем 180 стран представили на суд жюри свои предложения. К участникам конкурса предъявлялось два требования. Во-первых, победитель должен был уступить Netflix права на свой алгоритм. И во-вторых, он должен был «объяснить миру, как ему удалось решить эту задачу и каким образом она работает»{27}.

В 2009 году Netflix объявила победителя. Им стала группа из семи человек, в состав которой входили статистики и программисты из США, Австрии, Канады и Израиля. Увы, я не могу описать здесь – даже в приложении – систему-победителя. Объяснение принципа ее действия занимает 92 страницы. Качество рекомендаций Netflix произвело на меня неизгладимое впечатление. Тем не менее система Netflix – просто супернавороченная вариация того, чем занимаются люди с момента появления кинематографа: найти кого-либо со схожими вкусами и попросить порекомендовать вам тот или иной фильм. Вам, как правило, нравятся те же фильмы, что и мне, и не нравятся те же фильмы, что и мне. Так что вы думаете о новом фильме Джорджа Клуни?

В этом и состоит суть корреляции.

Приложение к главе 4

Чтобы вычислить коэффициент корреляции между двумя совокупностями чисел, вы должны выполнить перечисленные ниже действия, каждое из которых иллюстрируется путем использования данных о значениях роста и веса для 15 гипотетических учащихся в приведенной ниже таблице.

1. Преобразуйте рост каждого учащегося в стандартные единицы: (рост ‒ среднее значение) / стандартное отклонение.

2. Преобразуйте вес каждого из учащихся в стандартные единицы: (вес ‒ среднее значение) / стандартное отклонение.

3. Для каждого учащегося вычислите произведение (вес в стандартных единицах) × (рост в стандартных единицах). Вы должны увидеть, что это число будет самым большим по абсолютному значению, когда рост и вес ученика расположены относительно далеко от своих средних значений.

4. Коэффициент корреляции представляет собой сумму произведений, вычисленных выше, деленную на количество наблюдений (в нашем случае – 15).

Корреляция между ростом и весом для этой группы учащихся – 0,83. Учитывая, что коэффициент корреляции может находиться в диапазоне от −1 до 1, это относительно высокая степень положительной корреляции, чего и следовало ожидать.

A – Учащийся; B – Рост; C – Вес; D – Рост в стандартных единицах; E – Вес в стандартных единицах; F – (Вес в стандартных единицах) × (Рост в стандартных единицах)


Формула для вычисления коэффициента корреляции требует небольшого отступления, которое понадобится для того, чтобы объяснить систему обозначений, используемую в данном случае. Символ ∑ часто применяется в статистике. Он обозначает суммирование величин, которые указаны после него. Если, например, имеется некая совокупность наблюдений x1, x2, x3 и x4, то запись ∑ (xi) говорит о том, что мы должны суммировать четыре наблюдения: x1 + x2 + x3 + x4. Таким образом, ∑ (xi) = x1 + x2 + x3 + x4. Наша формула для среднего значения совокупности из n наблюдений может быть представлена в следующем виде: среднее значение = ∑ (xi)/n.

Мы можем придать этой формуле еще более универсальный вид, записав ее как Эта формула означает суммирование величин x1 + x2 + x3 +…+ xn, или, другими словами, начиная с x1 (поскольку i = 1) до xn включительно (поскольку i = n). Наша формула для среднего значения совокупности из n наблюдений может быть представлена в следующем виде:


С учетом этой универсальной системы обозначений формула вычисления коэффициента корреляции r для двух переменных x и y может выглядеть так:


где

n – количество наблюдений;

x – среднее значение для переменной x;

y – среднее значение для переменной y;

σx – стандартное отклонение для переменной x;

σy – стандартное отклонение для переменной y.

Любая статистическая компьютерная программа может с помощью статистических инструментов вычислить коэффициент корреляции между двумя переменными. Использование Microsoft Excel в примере с ростом и весом учащихся позволяет получить такую же корреляцию между ростом и весом пятнадцати учащихся, что и вычисление, выполненное нами вручную на основе приведенной выше таблицы: 0,83.

5. Основы теории вероятностей

Не покупайте расширенную гарантию для своего 99-долларового принтера

В 1981 году Joseph Schlitz Brewing Company потратила 1,7 миллиона долларов на необычайно смелую и рискованную маркетинговую кампанию для своего слабеющего бренда Schlitz. В перерыве матча за Суперкубок американского футбола Joseph Schlitz Brewing Company перед 100-миллионной зрительской аудиторией из разных стран мира провела в прямом эфире сравнительную дегустацию пива Schlitz Beer и его главного конкурента – пива Michelob{28}, причем участвовали в ней не случайные люди, а сотня любителей пива Michelob. Это стало кульминацией маркетинговой кампании, проходившей в ходе игр плей-офф NFL{29}. Всего транслировалось пять таких дегустаций; в каждой участвовало по 100 любителей конкурирующих сортов пива (Budweiser, Miller или Michelob), вслепую дегустировавших свой любимый сорт пива и Schlitz Beer. Каждый сеанс сопровождался рекламой, агрессивность которой не уступала агрессивности игр плей-офф (например, «Следите за сравнительной дегустацией Schlitz и Budweiser, проводимой во время игр плей-офф AFC»).

Маркетинговый месседж был совершенно четким: даже те, кому кажется, что они любят другой сорт пива, во время слепой дегустации отдают предпочтение пиву Schlitz. Во время матча за Суперкубок компания даже воспользовалась услугами одного из бывших судей NFL, который выступал в роли наблюдателя за ходом дегустации. Учитывая рискованный характер трансляции подобного действа в прямом эфире, вы, должно быть, подумали, что Joseph Schlitz Brewing Company выпустила потрясающее пиво?

Необязательно. В этом случае компании, которая знает толк в статистике, было достаточно предложить потребителям вполне ординарное пиво. Руководство Joseph Schlitz Brewing Company понимало, что такая уловка – слово, которым я стараюсь не злоупотреблять, даже когда речь идет о рекламе пива, – почти наверняка сработает. Большинство сортов пива в категории Schlitz имеют примерно одинаковый вкус, и парадокс заключается в том, что Joseph Schlitz Brewing Company использовала в своей рекламной кампании именно это обстоятельство. Допустим, что рядовой любитель пива, так сказать «человек с улицы», неспособен отличить пиво Schlitz от Budweiser, Michelob или Miller. В таком случае сравнительная дегустация (выполняемая вслепую) любой пары сортов пива, по сути, равноценна подбрасыванию монеты. В среднем половина дегустаторов-любителей выберет Schlitz, а другая половина – пиво конкурента. Уже один этот факт, скорее всего, не позволил бы провести особо эффективную рекламную кампанию. («Вы не в состоянии уловить разницу, поэтому вполне могли бы пить Schlitz».) С другой стороны, Joseph Schlitz Brewing Company, безусловно, не хотелось бы проводить подобную акцию среди собственных лояльных клиентов, поскольку примерно половина из них предпочла бы какой-либо из конкурирующих сортов пива. А это очень плохо, когда приверженцы вашего бренда в ходе слепой дегустации выбирают какой-либо из сортов конкурентов, – но именно этот прием Joseph Schlitz Brewing Company пыталась против них применить.

Schlitz придумала умнейший ход. Гвоздем ее рекламной кампании стало проведение сравнительной дегустации среди любителей пива, отдающих предпочтение конкурирующим сортам этого напитка. Если слепая дегустация действительно равносильна подбрасыванию монеты, то примерно половина любителей Budweiser, Michelob или Miller обязательно выберет Schlitz. В результате Schlitz предстанет в более выгодном свете, чем конкуренты: половине любителей Budweiser понравилось пиво Schlitz!

Все это выглядит особенно убедительно в перерыве матча за Суперкубок, если дегустацией руководит бывший арбитр NFL (в соответствующей униформе). Вместе с тем это действо происходит в прямом телеэфире. Даже если статистикам из Joseph Schlitz Brewing Company предварительно удалось выяснить (в результате многочисленных дегустаций, проводившихся в частном порядке), что типичный любитель Michelob в половине случаев предпочтет пиво Schlitz, то как быть, если 100 любителей пива Michelob «начудят» во время дегустации в прямом эфире? Конечно, слепая дегустация равноценна подбрасыванию монетки, но все же как быть, если большинство дегустаторов чисто случайно выберут Michelob? В конце концов, если бы мы собрали тех же 100 парней и попросили их подбросить монетку, то вполне возможно, что в 85 или даже в 90 случаях из 100 выпала бы решка. Такая случайность во время дегустации в прямом эфире стала бы для бренда Schlitz подлинной катастрофой (не говоря уж о потере 1,7 миллиона долларов, затраченных на покупку телевизионного рекламного времени).

Но на помощь пришла статистика! Если бы в нашем мире существовал некий супергерой статистики[19], то именно сейчас должен был бы появиться в штаб-квартире Joseph Schlitz Brewing Company и поведать о том, что статистики называют биномиальным экспериментом (или экспериментом Бернулли). Ключевые характеристики биномиального эксперимента таковы: наличие некоего фиксированного числа испытаний (например, 100 дегустаторов), каждое с двумя возможными исходами (Schlitz или Michelob), и одинаковая вероятность «успеха» в каждом испытании. (Я предполагаю, что вероятность отдать предпочтение одному или другому сорту пива равна 50 %; кроме того, я определяю успех как выбор дегустатором пива Schlitz.) Мы также исходим из того, что все испытания независимы, то есть решение одного дегустатора не оказывает влияния на решение другого.

Основываясь лишь на этой информации, наш статистический супергерой может вычислить вероятность всех исходов для 100 испытаний, например 52 Schlitz и 48 Michelob или 31 Schlitz и 69 Michelob. Те из нас, кто не претендует на звание супергероя, могут воспользоваться компьютером, чтобы получить тот же результат. Вероятность того, что все 100 дегустаторов выберут пиво Michelob, составляет 1 шанс из 1 267 650 600 228 229 401 496 703 205 376. Должен сказать, что вероятность того, что все дегустаторы погибнут вследствие падения астероида в перерыве матча за Суперкубок NFL, будет, пожалуй, даже меньше. Для нас гораздо важнее тот факт, что те же базовые вычисления позволяют определить суммарную вероятность для целого ряда исходов, например вероятность того, что 40 или меньше дегустаторов предпочтут пиво Schlitz. Эти подсчеты наверняка развеют опасения сотрудников маркетингового отдела Joseph Schlitz Brewing Company.

Предположим, что Joseph Schlitz Brewing Company вполне бы устроило, если бы по меньшей мере 40 из 100 дегустаторов выбрали пиво Schlitz – впечатляющий результат слепой дегустации, если принять во внимание, что все 100 дегустаторов – любители пива Michelob. Между тем вероятность подобного (очень и очень неплохого) исхода весьма высока. Если такая дегустация действительно равноценна подбрасыванию монеты, то, согласно теории вероятностей, вероятность того, что по меньшей мере 40 из 100 дегустаторов выберут пиво Schlitz, равняется 98 %, а вероятность того, что пиво Schlitz предпочтут как минимум 45 из 100 дегустаторов, – 82 %[20]. Так что теоретически никакого особого риска в затее Joseph Schlitz Brewing Company не было.

Итак, чем же закончился этот трюк для Joseph Schlitz Brewing Company? В перерыве матча за Суперкубок NFL 1981 года в ходе слепой сравнительной дегустации ровно 50 % любителей пива Michelob отдали предпочтение Schlitz.

Из этого примера следуют два важных урока: во-первых, вероятность – чрезвычайно мощный инструмент, и во-вторых, многие ведущие сорта пива в 1980-е годы были практически неотличимы друг от друга. Но в этой главе мы сосредоточимся именно на первом уроке.

Теория вероятностей – это наука о событиях и исходах, содержащих элемент неопределенности. Инвестирование на рынке ценных бумаг сопряжено с неопределенностью. То же касается и подбрасывания монетки, в результате которого может выпасть орел или решка. Подбрасывание монетки четыре раза подряд порождает дополнительные уровни неопределенности, поскольку каждое из четырех подбрасываний способно привести к выпаданию орла или решки. Следовательно, вы не можете заранее знать исход этого эксперимента. Тем не менее я могу с некоторой долей уверенности говорить, что одни исходы (два раза орел, два раза решка) более вероятны, чем другие (четырежды орел). Как справедливо решили сотрудники Joseph Schlitz Brewing Company, выводы, основанные на теории вероятностей, могут оказаться чрезвычайно полезными. Вообще говоря, если вы поймете, почему вероятность выпадания орла четыре раза подряд равняется одному шансу из 16 (если, конечно, при этом не используется монетка со смещенным центром тяжести), то наверняка начнете понимать (приложив немного умственных усилий) буквально все, от принципа работы страховой индустрии до действий профессиональной футбольной команды в той или иной игровой ситуации (например, почему они совершили дополнительный удар после тачдауна или предпочли двухочковый переход).

Начнем с самого легкого: вероятности многих событий известны заранее. Вероятность выпадания орла при однократном подбрасывании «правильной» монетки равняется ½, а единицы при однократном подбрасывании игральной кости – 1/6. Выводы относительно вероятности наступления других событий можно сделать на основе прошлых данных. Вероятность успешного выбивания дополнительного очка после тачдауна в профессиональном футболе составляет 0,94; это означает, что бьющие по мячу игроки совершают в среднем 94 из каждых 100 дополнительных попыток. (Очевидно, что эта величина может несколько разниться у разных игроков; кроме того, она зависит от погодных условий и прочих сторонних факторов, однако не может существенно отклоняться от 0,94.) Наличие такого рода информации и умение правильно ее оценить зачастую облегчает принятие решений и позволяет лучше уяснить риски. Например, Австралийский совет по безопасности на транспорте опубликовал отчет о количественной оценке фатальных рисков при авариях на разных видах транспорта. Несмотря на широко распространенную боязнь летать самолетами, риски, связанные с пассажирскими авиаперевозками, ничтожно малы. Начиная с 1960-х годов в гражданской авиации Австралии не зафиксировано ни одной катастрофы со смертельным исходом; таким образом, коэффициент смертности в расчете на каждые 100 миллионов километров «налета», по сути, равен нулю. Для автомобильного транспорта он составил 0,5. В этом отчете впечатляет показатель для мотоциклистов. Для тех, кого вдохновляет идея стать донором органов, сообщаем: у мотоциклистов доля несчастных случаев со смертельным исходом в расчете на каждые 100 миллионов километров пробега в тридцать пять раз выше, чем у автомобилистов{30}.

В сентябре 2011 года 6,5-тонный спутник НАСА начал падение на Землю; ожидалось, что при прохождении плотных слоев атмосферы он распадется на части. Какой была вероятность того, что вам на голову упадет один из осколков этого спутника? Может быть, мне не следовало в те дни отправлять детей в школу? По оценке ученых-ракетчиков НАСА, вероятность попадания одного из фрагментов спутника в какого-то конкретного человека составляла 1 шанс из 21 триллиона. Тем не менее вероятность того, что кто-либо где-либо на Земле будет ушиблен куском этого спутника, оказалась не так уж мала – 1 шанс из 3200[21]. В конечном счете спутник действительно развалился на части, но куда именно они упали, науке до сих пор неизвестно{31}. Зато известно, что никто не обращался за медицинской помощью по причине такого рода травмирования. Вероятность не говорит нам о том, что случится наверняка; она лишь предупреждает, что может произойти с высокой степенью вероятности или с менее высокой. Здравомыслящие люди могут использовать эти данные у себя на работе или в повседневной жизни. Например, когда вы слышите по радио сообщение о том, что на Землю падает очередной спутник, вовсе не обязательно мчаться домой на мотоцикле, чтобы предупредить семью.

Когда речь заходит о риске, наши страхи не всегда бывают адекватны тому, что говорят нам числа о реальной опасности, которой мы подвергаемся, то есть о том, чего нам действительно следует бояться. Один из поразительных выводов сделали Стивен Левитт и Стивен Дабнер, авторы книги «Фрикономика»[22] (Freakonomics), заявив, что плавательный бассейн во дворе вашего дома гораздо опаснее, чем заряженный револьвер, хранящийся у вас в шкафу{32}. Левитт и Дабнер подсчитали: вероятность того, что ребенок в возрасте до десяти лет утонет в плавательном бассейне, в сто раз превышает вероятность того, что он случайно застрелится, играя с вашим револьвером (если, конечно, найдет его в шкафу)[23]. В интересной статье трех исследователей из Корнелльского университета – Гаррика Блалока, Вринды Кадияли и Дэниела Саймона – сообщается о том, что тысячи американцев, возможно, умерли после теракта 11 сентября из-за страха летать самолетами{33}. Мы никогда не узнаем подлинных рисков, связанных с терроризмом; однако нам доподлинно известно, что вождение автомобиля – опасное занятие. Когда после теракта 11 сентября американцы решили больше ездить наземным транспортом, чем летать, ежемесячное количество дорожно-транспортных происшествий в октябре, ноябре и декабре 2001 года, согласно оценкам авторов данного исследования, увеличилось на 344 случая (с учетом среднего количества погибших и факторов, которые обычно способствуют ДТП, например погодных условий). Со временем – предположительно в результате уменьшения боязни терроризма – этот эффект сам по себе сошел на нет, но, по оценкам исследователей, теракты 11 сентября как таковые привели к более чем 2000 дорожно-транспортных происшествий со смертельным исходом.

Иногда вероятность может также говорить нам постфактум, что, по-видимому, произошло и что, по-видимому, не произошло – как в случае с анализом ДНК. Когда эксперты в телесериале CSI: Miami находят следы слюны на огрызке яблока рядом с жертвой преступления, в этой слюне нельзя обнаружить имя убийцы, даже если ее рассматривает через мощный микроскоп очень симпатичная девушка-эксперт. Однако эта слюна (или волос, или кусочек кожи или кости) содержит сегмент ДНК, в котором, в свою очередь, есть участки (локусы), специфические для каждого человека (за исключением однояйцовых близнецов, имеющих одну и ту же ДНК). Когда медэксперт заключает, что у некоего образца ДНК выявлено совпадение, это лишь часть того, что предстоит доказать следствию. Да, определенные локусы на образце ДНК, взятом с места преступления, должны совпадать с соответствующими локусами на образце ДНК, взятом у подозреваемого. Тем не менее следователям также предстоит доказать, что такое совпадение неслучайно.

ДНК у разных людей бывают похожи, как и многие другие характеристики: размер обуви, рост, цвет глаз. (Свыше 99 % ДНК у людей идентичны.) Если в распоряжении исследователей есть только малый образец ДНК, на котором можно проверить лишь пару-тройку участков, то вполне возможно, что у тысяч или даже миллионов людей окажется точно такой же генетический фрагмент. Следовательно, чем большее число локусов будет проверено и чем большее естественное генетическое отклонение будет в каждом из них обнаружено, тем определеннее окажется совпадение. Можно сказать и по-другому: тем меньше вероятность того, что данный образец ДНК совпадет с несколькими людьми{34}.

Чтобы лучше уяснить ситуацию с ДНК, представьте, что ваше «число ДНК» состоит из вашего телефонного номера, присоединенного к номеру вашей карточки социального страхования. Эта последовательность из девятнадцати цифр идентифицирует вас уникальным образом. Допустим, что каждая такая цифра представляет собой «участок» с десятью возможностями: 0, 1, 2, 3 и т. д. Предположим также, что следователи обнаружили на месте преступления остаток некоего «числа ДНК»: _ _ 4 5 9 _ _ _ 4 _ 0 _ 9 8 1 7 _ _ _. Оказалось, что этот фрагмент в точности совпадает с вашим «числом ДНК». Итак, вы – преступник?

Следует обратить внимание на три вещи. Во-первых, все, что меньше чем полное совпадение с полным геномом, оставляет некоторый простор для неопределенности. Во-вторых, чем больше локусов, которые мы можем проверить, тем меньше неопределенность. И в-третьих, важен контекст. Выявленное совпадение было бы чрезвычайно убедительным, если бы нашлись свидетели того, как вы пытались скрыться с места преступления, или если бы у вас в кармане обнаружили кредитную карточку жертвы.

Когда следователи располагают неограниченным временем и ресурсами, типичный процесс включает в себя проверку тринадцати разных локусов. Шансы, что профиль ДНК у двух разных человек совпадает по всем тринадцати локусам, чрезвычайно малы. Когда для идентификации останков, найденных во Всемирном торговом центре после терактов 11 сентября, использовался анализ ДНК, образцы, обнаруженные на месте трагедии, сравнивались с образцами, предоставленными членами семей жертв теракта. Вероятность, требовавшаяся для позитивной идентификации, равнялась один из миллиарда; то есть вероятность того, что останки принадлежат кому-то другому, а не идентифицируемой жертве, не превышает одного шанса из миллиарда. Впоследствии, по мере того как оставалось все меньше и меньше неидентифицированных жертв, с которыми могли бы быть спутаны останки, этот стандарт был ослаблен.

Если ресурсы ограниченны или имеющийся образец ДНК слишком мал или загрязнен, чтобы можно было проверить тринадцать локусов, ситуация становится более запутанной и спорной. В 2008 году газета Los Angeles Times опубликовала серию материалов, посвященных использованию ДНК при расследовании преступлений{35}. В частности, издание задалось вопросом, не недооценена ли возможность случайных совпадений при использовании стандарта вероятности, определяемого законом. (Поскольку профиль ДНК всего населения не знает никто, то вероятности, на которые ссылаются в суде ФБР и другие правоохранительные органы, носят лишь оценочный характер.) Весьма неоднозначную реакцию в обществе вызвала информация о том, что эксперт-криминалист из Аризоны, выполнявший тесты на основе базы данных ДНК этого штата, обнаружил совпадение ДНК на девяти локусах у двух опасных уголовных преступников, не являющихся родственниками; между тем, согласно ФБР, вероятность такого совпадения равна одному шансу из 113 миллиардов. Дальнейший поиск в других базах данных ДНК позволил выявить свыше тысячи пар людей с генетическими совпадениями на девяти и более локусах. Это может служить серьезным поводом к размышлению для правоохранительных органов и адвокатов. Пока же важный для нас урок заключается в том, что анализ ДНК, на который возлагаются столь большие надежды, хорош лишь настолько, насколько надежны значения вероятности, подкрепляющие его.

Зачастую бывает очень полезно знать вероятность одновременного наступления нескольких событий. Какова вероятность исчезновения электричества в сети и выхода из строя автономного генератора? Вероятность одновременного наступления двух независимых событий представляет собой произведение их соответствующих вероятностей. Другими словами, вероятность наступления события A и события B равна вероятности наступления события A, умноженной на вероятность наступления события B. Чтобы вам стало понятнее, приведу соответствующий пример. Если вероятность выпадания орла при однократном подбрасывании монетки составляет ½, то вероятность его выпадания при подбрасывании такой же монетки два раза подряд равняется ½ × ½ = ¼; три раза подряд – ⅛; четыре раза подряд – 1/16 и т. д. (Понятно, что вероятность выпадания решки при подбрасывании монетки четыре раза подряд также составляет 1/16.) Это объясняет, почему системный администратор в вашем учебном заведении или офисе постоянно напоминает вам о необходимости усложнить пароль. Если вы используете шестизначный пароль, состоящий только из цифр, мы можем подсчитать количество возможных паролей: 10 × 10 × 10 × 10 × 10 × 10, что равняется 106, или 1 000 000. На первый взгляд, количество комбинаций настолько велико, что угадать пароль сложно, однако компьютер проверит все эти 1 000 000 вариантов за какую-то долю секунды.

Допустим, системный администратор убеждает вас включить в пароль буквы. На данном этапе для каждого из шести разрядов имеется 36 комбинаций: 26 букв английского алфавита и 10 цифр. Итак, количество возможных паролей возрастает до 36 × 36 × 36 × 36 × 36 × 36, или 366, то есть свыше двух миллиардов. Если ваш системный администратор требует, чтобы пароль состоял из восьми цифр, и призывает использовать символы #, @, % и! как в Чикагском университете, то количество потенциальных паролей увеличивается до 468, то есть свыше 20 триллионов.

Здесь нужно сделать одно важное замечание. Эта формула применима только если события независимы; иными словами, когда исход одного события не оказывает влияния на исход другого события. Например, вероятность того, что в результате первого подбрасывания монетки выпадет орел, не влияет на вероятность исхода второго подбрасывания той же монетки. С другой стороны, вероятность того, что сегодня пойдет дождь, не независима от того, был ли он вчера, поскольку грозовые фронты могут сохраняться на протяжении нескольких дней. Аналогично, вероятность того, что сегодня ваш автомобиль попадет в аварию, и того, что он попадет в нее в следующем году, также не независимы друг от друга. То, что привело к аварии вашего автомобиля в этом году, может спровоцировать ДТП и в следующем году: возможно, вы склонны садиться за руль в нетрезвом состоянии, или вам нравится устраивать гонки на дороге, или строчить эсэмэски во время вождения; наконец, не исключено, что вы просто плохой водитель. (Именно поэтому после каждого очередного ДТП ваша страховая ставка повышается; дело не столько в желании страховой компании компенсировать деньги, выплаченные ею согласно страховому договору, сколько в том, что теперь она располагает новой информацией о вероятности вашего попадания в дорожно-транспортные происшествия в дальнейшем, поскольку – после того как вы, заезжая в гараж, сильно поцарапали свой автомобиль – такая вероятность повысилась.)

Допустим, вас интересует вероятность наступления одного (исхода A) или другого (исхода B) события (опять же предполагая, что они независимы). В этом случае вероятность наступления события A или B равна сумме их индивидуальных вероятностей, то есть вероятность A плюс вероятность B. Например, вероятность выпадания 1, 2 или 3 в результате подбрасывания одной игральной кости равняется сумме их отдельных вероятностей: 1/6 + 1/6 + 1/6 = 3/6 = ½. Это должно быть интуитивно понятно. При подбрасывании игральной кости есть шесть возможных исходов. Числа 1, 2 и 3 в совокупности составляют половину из них. Следовательно, вероятность выпадания 1, 2 или 3 вследствие подбрасывания одной игральной кости равняется 50 %. Если вы играете в кости в Лас-Вегасе, то вероятность выпадания 7 или 11 в результате однократного подбрасывания равна количеству комбинаций, составляющих в сумме 7 или 11, поделенному на общее число вариантов, которые могут выпасть в результате подбрасывания двух игральных костей, или 8/36[24].

Вероятность также позволяет подсчитать математическое ожидание – чрезвычайно полезный инструмент, используемый при принятии любых управленческих решений, особенно в сфере финансов. Математическое ожидание – это среднее значение случайной величины. Математическое ожидание, или отдача (функция выигрыша) от некоторого события, например покупки лотерейного билета, представляет собой сумму всех разных исходов, весовыми коэффициентами при каждом из которых являются вероятность исхода и выигрыш. Как обычно, приведем пример, чтобы прояснить смысл сказанного. Допустим, вам предложили сыграть в кости, причем подбрасывается только одна игральная кость. Функция выигрыша в этой игре такова: 1 доллар, если у вас выпадает 1; 2 доллара, если у вас выпадает 2; 3 доллара, если у вас выпадает 3 и т. д. Каково математическое ожидание в случае однократного подбрасывания игральной кости? Вероятность каждого из возможных исходов равняется 1/6, поэтому математическое ожидание вычисляется так:

⅙ ($1) + ⅙ ($2) + ⅙ ($3) + ⅙ ($4) + ⅙ ($5) + ⅙ ($6) = 21/6, или $3,50.

На первый взгляд, математическое ожидание 3,50 доллара кажется относительно бесполезной величиной. В конце концов, вы не можете фактически заработать 3,50 доллара в результате однократного подбрасывания игральной кости (так как ваш доход в любом случае должен равняться целому числу). На самом деле математическое ожидание представляет собой чрезвычайно мощный инструмент, поскольку он может сказать вам, является ли то или иное событие «справедливым», учитывая его цену и ожидаемый исход. Допустим, вам предлагают поучаствовать в описанной выше игре при ставке 3 доллара за каждое подбрасывание игральной кости. Имеет ли смысл соглашаться на такие условия? Да, поскольку математическое ожидание исхода (3,50 доллара) выше, чем стоимость игры (3,00 доллара). Это не означает, что вы обязательно заработаете деньги в результате однократного подбрасывания игральной кости, но помогает уяснить, на какой риск стоит пойти, а на какой – нет.

Этот гипотетический пример можно применить к профессиональному американскому футболу. Как указывалось ранее, после тачдауна команда может либо пробить и заработать дополнительное очко, либо попытаться выполнить двухочковую конверсию. Первый вариант предполагает такой удар по мячу с трехъярдовой линии, в результате которого мяч должен пройти между стойками ворот; второй вариант предполагает пробежку или передачу мяча в концевую зону с трехъярдовой линии, что значительно труднее. Команда может предпочесть более легкий вариант и заработать одно очко или выбрать более сложный вариант и заработать два очка. Как быть?



Поделиться книгой:

На главную
Назад