27
Ранее в этой книге я привел пример, в котором упоминалось о нетрезвых работниках, выпускающих бракованные лазерные принтеры. Выбросьте его из головы: будем исходить из того, что компания, выпускающая лазерные принтеры, уже решила проблемы с качеством.
28
Так как я советовал вам с осторожностью относиться к описательным статистикам, я чувствую себя обязанным отметить, что автомобиль, который угоняют чаще всего, вовсе не обязательно является автомобилем, который угоняют вероятнее всего. Большое число автомобилей марки Honda Civic угоняют именно потому, что это самая распространенная марка, между тем как вероятность угона какого-либо отдельно взятого автомобиля марки Honda Civic (а именно это интересует страховые компании, страхующие от угона автомобилей) может оказаться весьма низкой. Напротив, даже если угоняют 99 % всех автомобилей Ferrari, автомобиль этой марки не возглавил бы список «наиболее часто угоняемых», поскольку таких автомобилей сравнительно мало и, следовательно, их угоняют довольно редко.
29
Вы можете сыграть в эту игру на сайте http://www.nytimes.com/2008/04/08/science/08monty.html?_r=2&oref=slogin&oref=slogin.
30
Издана на русском языке: Талеб Н. Черный лебедь. Под знаком непредсказуемости. – М.: КоЛибри, 2009.
31
СВСМ по-прежнему остается медицинской загадкой, хотя многие из факторов риска, связанных с этим феноменом, удалось выявить. Например, смертность у младенцев можно резко снизить, если ребенка укладывать спать на спину.
32
Вместе с тем в теории вероятностей доказан факт, что если достаточно долго подбрасывать монету, то будут наблюдаться периоды преобладания выпадания орла или решки. Это так называемый первый закон арксинуса. Этот закон не отменяет сказанного автором, а только показывает структуру исходов в испытаниях Бернулли. О данном феномене см., например, классическую книгу В. Феллер. Введение в теорию вероятностей и ее приложения. Т. 1. Глава III. Прим. ред.
33
Chicago Cubs – профессиональный бейсбольный клуб, выступающий в Центральном дивизионе Национальной бейсбольной лиги. Прим. перев.
34
Указанное изменение политики Еврокомиссии было в конечном счете разъяснено в особом постановлении Верховного суда Евросоюза от 2011 года. В этом постановлении было указано, что применение разных надбавок к мужчинам и женщинам представляет собой дискриминацию по половому признаку.
35
Известный принцип программирования, в соответствии с которым неверные входные данные не могут привести к правильному результату. Прим. перев.
36
На тот момент средняя продолжительность этой болезни составляла сорок три дня со среднеквадратическим отклонением, равным двадцати четырем дням.
37
Standard & Poor’s 500 – показательный пример того, что может и должен делать любой индекс. Этот индекс составлен из цен акций 500 ведущих американских компаний с учетом рыночной стоимости каждой из этих компаний (так, чтобы более крупные компании имели в этом индексе больший вес, чем мелкие). Данный индекс – простой и точный показатель того, что происходит с ценами акций крупнейших американских компаний в любой момент времени.
38
С очень интересным обсуждением того, почему следует отдать предпочтение покупке индексных фондов, вместо того чтобы пытаться превзойти рынок, можно ознакомиться в книге моего бывшего преподавателя, профессора Бертона Малкиела (Burton Malkiel) A Random Walk Down Wall Street (Случайная прогулка по Уолл-стрит. – Минск: Попурри, 2006).
39
Леброн Рэймон Джеймс (LeBron Raymone James) – американский профессиональный баскетболист, играющий на позиции легкого и тяжелого форварда за команду НБА «Кливленд Кавальерс». Прим. перев.
40
Обратите внимание на весьма остроумное использование в данном случае ложной точности.
41
Когда среднеквадратическое отклонение соответствующей совокупности вычисляется на основании меньшей выборки, приведенная нами формула несколько видоизменяется: SE = s ÷ √(n − 1). Это помогает учесть то обстоятельство, что дисперсия в малой выборке может «недооценивать» дисперсию всей совокупности. Это не имеет особого отношения к более универсальным положениям, о которых идет речь в данной главе.
42
Мой коллега из Чикагского университета, Джим Сэлли, сделал очень важное критическое замечание по поводу примеров с пропавшим автобусом. Он указал, что пропавший автобус – чрезвычайно большая редкость в наше время. Поэтому если нам придется искать какой-нибудь пропавший автобус, то любой встретившийся нам автобус, который окажется пропавшим или поломавшимся, наверняка будет именно тем автобусом, который нас интересует, каким бы ни был вес пассажиров в этом автобусе. Пожалуй, Джим прав. (Воспользуюсь такой аналогией: если вы потеряли в супермаркете своего ребенка и дирекция этого магазина сообщает по радио, что возле кассы номер шесть стоит чей-то потерявшийся ребенок, то вы наверняка сразу же решите, что речь идет именно о вашем ребенке.) Следовательно, нам не остается ничего другого, как дополнить наши примеры еще одним элементом абсурда, полагая, что пропажа автобуса является вполне рядовым событием.
43
С точки зрения семантики мы еще не доказали, что нулевая гипотеза истинная (то есть что лечение заключенных от наркозависимости не имеет никакого эффекта). Такое лечение может оказаться чрезвычайно эффективным для какой-либо другой группы заключенных. Или, возможно, в этой подопытной группе значительно большее число заключенных совершили бы повторные преступления, если бы не прошли курс лечения от наркозависимости. В любом случае на основе собранных данных нам просто не удалось отвергнуть нулевую гипотезу. Существует аналогичная разница между «неспособностью отвергнуть» нулевую гипотезу и ее принятием. Сам по себе факт, что одному исследованию не удалось опровергнуть утверждение о том, что лечение от наркозависимости не помогает предотвратить повторный арест, еще не означает, что мы должны согласиться с тем, что лечение от наркозависимости бесполезно. С точки зрения статистики здесь имеет место существенная разница. С учетом сказанного следует отметить, что подобные исследования зачастую проводятся с целью информирования полиции, и тюремная администрация, которой приходится решать, как правильно распределить ресурсы, может считать лечение от наркозависимости неэффективным инструментом до тех пор, пока не убедится в обратном. В этом случае, как и в других при использовании статистических данных, следует полагаться на здравый смысл.
44
В статистике уровнем значимости называют вероятность отклонить нулевую гипотезу при условии, что она истинна. Это так называемая ошибка первого рода. Об этой ошибке см. далее. Прим. ред.
45
Этот пример навеян реальными событиями. Понятное дело, многие подробности изменены исходя из соображений национальной безопасности. Что же касается меня, то я не могу ни подтвердить, ни отрицать в них своего участия.
46
Точнее говоря, 95 % средних значений всех выборок будут находиться в пределах 1,96 стандартной ошибки выше или ниже среднего значения совокупности.
47
Существуют две возможные альтернативные гипотезы. Первая заключается в том, что профессиональные баскетболисты выше, чем мужское население в целом. Вторая – что средний рост профессиональных баскетболистов отличается от среднего роста мужского населения в целом (при этом не будем забывать о вероятности того, что рост профессиональных баскетболистов может в действительности быть меньшим, чем у некоторых обычных мужчин). Это различие не играет большой роли при выполнении проверки по критерию значимости и вычислении p-значения. Соответствующее объяснение можно найти в более подробных учебниках по статистике, однако это не играет особой роли для нашего обсуждения, имеющего более общий характер.
48
Сознаюсь, что однажды в отчаянии я изорвал одну книгу по статистике.
49
Еще одним ответом могла бы стать попытка повторить полученные результаты в дополнительных исследованиях.
50
Ошибка второго рода – это вероятность принятия нулевой гипотезы тогда, когда она неверна. Прим. ред.
51
Согласно сайту движения Occupy Wall Street, это народное движение, которое возникло 17 сентября 2011 года в Либерти-сквер, финансовый округ Манхэттена, и распространилось на более чем 100 городов Соединенных Штатов, а также инициировало акции протеста в более чем 1500 городах по всему миру. Occupy Wall Street выступает против засилья крупных банков и транснациональных корпораций, оказывающих разлагающее влияние на демократический процесс, и против роли Уолл-стрит в создании экономического коллапса, который породил тяжелейшую рецессию за все время существования человечества. Это движение вызвано народными волнениями в Египте и Тунисе и ставит своей задачей показать, как 1 % самых богатых людей диктуют правила несправедливой глобальной экономики, которая становится непреодолимым препятствием на нашем пути в будущее.