Правда, на практике возникают кое-какие проблемы. Большинство совокупностей, которые могут представлять для нас интерес в реальной жизни, как правило, гораздо сложнее, чем урна с разноцветными шариками. Как, например, получить случайную выборку взрослого населения Америки, которую можно было бы использовать для проведения телефонного опроса? Даже такое элегантное на первый взгляд решение, как устройство для произвольного набора телефонных номеров, не лишено определенных недостатков. У некоторых людей (например, у малоимущих) может не быть телефона. Другие (обычно люди с высоким уровнем дохода) зачастую бывают не очень-то склонны отвечать на телефонные звонки, не представляющие для них непосредственного интереса. В главе 10 я опишу ряд стратегий, используемых компаниями, проводящими опросы, для решения проблем подобного рода, возникающих при формировании выборки (с появлением мобильной связи эти проблемы еще больше усложнились). Ключевая идея заключается в том, что надлежащим образом сформированная выборка будет полностью отражать структуру той совокупности, из которой она извлечена. Интуитивно вы можете представить себе это на примере варки супа в большой кастрюле. Если предварительно хорошенько размешать суп, то одна его ложка позволит вам составить достаточно полное представление о его вкусовых качествах.
В любом учебнике по статистике вы встретите значительно больше подробностей относительно методов формирования выборки. Компании, проводящие опросы и выполняющие маркетинговые исследования, тратят немало времени на поиск наиболее эффективных с экономической точки зрения способов получения надежных репрезентативных данных из разных совокупностей. На данном этапе вам необходимо уяснить несколько принципиальных положений. 1) Репрезентативная выборка – чрезвычайно важная вещь, поскольку она позволяет вам воспользоваться рядом наиболее мощных инструментов, которые имеются в распоряжении статистики. 2) Получить хорошую выборку гораздо сложнее, чем может показаться на первый взгляд. 3) Многие из самых ошибочных статистических утверждений обусловлены применением совершенно правильных статистических методов к плохим выборкам, а вовсе не наоборот. 4) Размер выборки имеет значение – чем она больше, тем лучше. Подробнее об этом мы поговорим в следующих главах, но уже сейчас вам должно быть интуитивно понятно, что крупная выборка дает возможность нивелировать любые аномальные отклонения. (Кастрюля супа, несомненно, более точно отражает его истинный вкус, чем ложка супа.) Важное предостережение: наращивание размера выборки не позволяет компенсировать ошибки, допущенные при выборе ее структуры (так называемую систематическую ошибку). Единственный способ устранения ошибок, порождаемых плохой выборкой, – использование хорошей выборки. Никакой суперкомпьютер или мудреная формула не помогут вам обеспечить правильность результатов общенационального телефонного опроса в преддверии президентских выборов, если в соответствующую выборку будут включены исключительно жители Вашингтона, потому что они обычно голосуют не совсем так, как остальная Америка, и даже если вы опросите не 1000, а 100 000 жителей этого округа, это не устранит данную фундаментальную проблему вашего опроса. Более того, применение крупной выборки, в которую вкралась систематическая ошибка, несомненно хуже небольшой выборки с такой же систематической ошибкой, поскольку это создает ложное мнение о надежности полученного результата.
Второе, что нам зачастую требуется от данных, – это чтобы они служили нам источником сравнения. Новое лекарство эффективнее нынешнего? Можно ли надеяться, что бывшие осужденные, освоившие в тюрьме какую-либо профессию, будут менее склонны к повторному совершению преступлений, чем бывшие осужденные, которые такую профессию не приобрели? Можно ли надеяться, что успеваемость учащихся престижных учебных заведений окажется лучше, чем учеников обычных государственных школ?
В подобных случаях наша задача – найти две группы субъектов, в целом похожих между собой – за исключением интересующего нас «параметра». В контексте социальных наук таким «параметром» может быть что угодно, от наличия у самца дрозофилы сексуальной неудовлетворенности до права налогоплательщика на скидку при уплате подоходного налога. Как и в случае любого применения научного метода, мы пытаемся изолировать влияние какого-то одного конкретного стороннего воздействия или фактора. В этом и состояла гениальность эксперимента с дрозофилами. Исследователям удалось найти способ создания контрольной (самцов, которые уже нашли себе пару) и «подопытной» (отвергнутых самцов) группы, а последующую разницу в отношении самцов к спиртному можно было объяснить их принадлежностью к той или иной группе.
В физических и биологических науках формирование контрольной и подопытной группы не представляет особой проблемы. Химики могут добиться небольших вариаций в нескольких пробирках, а затем изучить разницу в полученных результатах. Биологи могут использовать ту же методологию с помощью чашек Петри. Хотя должен заметить, что большинство экспериментов с животными проще провести, чем заставить дрозофил пить спиртное. Одну группу крыс можно заставить регулярно тренироваться на «беговой дорожке», а другую – нет, а затем сравнить их способность ориентироваться в лабиринте. Но когда речь идет о людях, все существенно усложняется. Чтобы правильно выполнить статистический анализ, зачастую требуется сформировать контрольную и подопытную группы, однако далеко не всегда люди согласны делать то же, что и крысы. (К тому же многим не нравится проделывать подобные эксперименты даже с лабораторными крысами.) Не вызовут ли периодически повторяющиеся сотрясения мозга у спортсменов серьезные неврологические проблемы в дальнейшем? Это действительно очень важный вопрос. От ответа на него зависит будущее хоккея на льду (и, возможно, других видов спорта). Однако сделать это невозможно путем проведения соответствующих экспериментов над людьми. Следовательно, пока (или если) мы не научим дрозофил носить шлемы и своевременно уворачиваться от силовых приемов, нам придется изыскивать другие способы изучения долговременных последствий травм головы.
Неизменной проблемой, которую приходится решать исследователям, работающим с «человеческим материалом», является создание контрольной и подопытной групп, отличающихся между собой только тем, что над одной группой проводится соответствующий опыт, а над другой – нет. Именно поэтому «золотым стандартом» исследования стала рандомизация, то есть процесс, посредством которого объекты изучения (люди, школы, больницы и т. д.) произвольным образом распределяются либо в подопытную, либо в контрольную группу. Мы не исходим из того, что все испытуемые идентичны. Напротив, вероятность – в который раз! – становится нашим союзником, и мы предполагаем, что рандомизация более-менее равномерно поделит все значимые характеристики между этими двумя группами – как те, которые нас интересуют, так и те, которые не интересуют или не подлежат измерению, например настойчивость или честность.
Третью причину сбора данных можно сформулировать так, как иногда любит объяснять свои поступки моя малолетняя дочь: «Потому что!» Иногда у нас нет четкого представления о том, для чего нам может понадобиться та или иная информация, но интуитивно мы предполагаем, что в какой-то момент она обязательно пригодится. Это похоже на работу следователя на месте преступления: ему необходимо собрать максимальное количество улик, чтобы впоследствии составить предельно полную картину преступления. Одни из этих материальных доказательств окажутся полезными, другие следствию не помогут. Если бы мы заранее знали наверняка, что именно нам пригодится, то предварительное расследование нам, наверное, было бы не нужно.
Вам, должно быть, известно, что курение и ожирение являются факторами риска, способствующими развитию сердечно-сосудистых заболеваний. Но, возможно, вы не знаете, что эту взаимосвязь помогло выявить обследование жителей города Фрамингема, проводившееся в течение длительного времени. Во Фрамингеме проживает около 67 000 человек, город расположен примерно в двадцати милях от Бостона. Обычным людям он известен как пригород Бостона с относительно дешевым жильем и удобным доступом к торговому центру Natick Mall, славящемуся своими высококачественными (и дорогостоящими) товарами. Что же касается ученых, то Фрамингем для них ассоциируется с исследованием под названием Framingham Heart Study – одним из самых успешных в истории современной науки, оказавшим огромное влияние на развитие медицины.