Шрифт:
Интервал:
Закладка:
Если мы подвергнем тестированию все взрослое население Соединенных Штатов, то есть приблизительно 175 миллионов человек, то дерево решений примет следующий вид:
Итак, только 1750 человек страдают этим заболеванием. У всех положительный результат теста. У остальных 174 с лишним миллионов взрослых этой болезни не выявлено. Для 99,9999 % протестированных результат был определен правильно: они здоровы. Ложный положительный результат получили всего 0,0001 % человек. Однако 0,0001 % от 174 миллионов все же достаточно большое число. По сути, это в среднем 17 500 человек.
Попытаемся проанализировать, что это означает. В общей сложности 19 250 человек уведомляются о том, что они страдают данным заболеванием, и лишь 9 % из них в действительности больны! А ведь речь идет о тесте с очень невысокой долей ложных положительных результатов. Не слишком отклоняясь от обсуждаемой темы, я привел этот пример, чтобы дать вам некоторое представление о том, почему методы сдерживания затрат в системе здравоохранения иногда предусматривают проведение обследования главным образом среди групп повышенного риска заболевания, а не среди здорового населения. В случае таких заболеваний, как ВИЧ/СПИД, представители государственной системы здравоохранения зачастую рекомендуют обследовать группы повышенного риска, например гомосексуалистов или наркоманов.
* * *Иногда вероятность сигнализирует нам об опасных ситуациях. В главе 1 рассказывалось о проблеме манипуляций со стандартизованными тестами и об одной из фирм, которая пыталась выявлять такие случаи, Caveon Test Security. Комиссия по ценным бумагам и биржам (Securities and Exchange Commission – SEC), государственное агентство, отвечающее за практическую реализацию федеральных законов, касающихся торговли ценными бумагами, применяет аналогичную методологию для обнаружения трейдеров-инсайдеров. (Инсайдерская торговля ценными бумагами связана с незаконным использованием конфиденциальной информации, такой как, скажем, знание юридической фирмой о предстоящем поглощении для торговли акциями и другими ценными бумагами компаний, участвующих в данном процессе.) SEC использует мощные компьютеры для анализа сотен миллионов операций купли-продажи ценных бумаг с целью выявления подозрительной активности, например крупной покупки акций компании непосредственно перед объявлением о ее поглощении или массовом «сбросе» акций компании буквально перед ее заявлением о резком сокращении прибыли{37}. SEC также расследует деятельность инвестиционных менеджеров с необычайно высокими прибылями на протяжении длительных периодов времени. (Как экономическая теория, так и исторические данные свидетельствуют, что отдельно взятому инвестору чрезвычайно трудно год за годом получать прибыль выше среднего уровня.) Разумеется, дальновидные инвесторы всегда пытаются прогнозировать хорошие и плохие новости и разрабатывать законные стратегии, которые позволяли бы неизменно достигать результата выше рыночного. Чтобы быть хорошим инвестором, вовсе не обязательно вступать в конфликт с законом. Как компьютер улавливает разницу между удачливыми инвесторами, действующими в рамках закона, и удачливыми инвесторами, преступившими закон? Я несколько раз звонил в отдел правоприменения SEC, чтобы выяснить это, однако сотрудники SEC не пожелали делиться со мной своими секретами.
В фильме 2002 года Minority Report Том Круз играет детектива, предотвращающего преступления. Его герой является сотрудником некоего бюро, которое использует определенную технологию для прогнозирования преступлений еще до того, как они будут совершены.
Нет, дорогие читатели, это уже не фантастика. В 2011 году в газете The New York Times вышла статья под заголовком: «Полиция прибывает на место до совершения преступления»{38}. В ней рассказывалось, что специальная компьютерная программа предсказала высокую вероятность совершения краж из автомобилей в этот день на подземной парковке, расположенной в деловом районе города Санта-Круз. Когда туда приехали детективы, они обнаружили двух женщин, слишком уж пристально всматривающихся в окна автомобилей. Одна из них уже неоднократно задерживалась за воровство, а у другой нашли запрещенные наркотики.
Система, использовавшаяся в Санта-Круз, была разработана двумя математиками, антропологом и криминалистом. Отдел полиции в Чикаго создал у себя целое подразделение аналитиков-прогнозистов. Частично его формирование объяснялось тем, что банды, терроризировавшие город, действовали по определенным шаблонам. Книга Data Mining and Predictive Analysis: Intelligence Gathering and Crime Analysis, руководство по статистике для правоприменения, начинается со следующего бодрого заявления: «Теперь можно составлять прогноз в отношении уголовных преступлений; например выявлять тенденции развития преступности, прогнозировать “горячие точки”совершения преступлений, уточнять решения, касающиеся выделения ресурсов на те или иные цели, и обеспечивать максимальную защиту граждан наиболее эффективными способами». (Обратите внимание: я ознакомился со всей этой информацией, чтобы кратко изложить ее для вас и сэкономить вам таким образом время.)
«Прогнозная полиция» является частью более широкого движения, которое называется «предиктивным анализом». Уголовные преступления всегда включают в себя элемент неопределенности: вы никогда не сможете сказать заранее, кто разобьет ваш автомобиль или не выполнит обязательств по вашей ипотеке. Вероятность помогает нам ориентироваться в таких рисках. А информация позволяет уточнить понимание соответствующих вероятностей. Компании, сталкивающиеся в своей деятельности с неопределенностью, всегда пытаются получить количественную оценку рисков. Кредиторы интересуются такими вещами, как реальный доход получателя кредита и его кредитный рейтинг. Однако эти несовершенные кредитные инструменты все больше напоминают нам некий эквивалент каменных орудий пещерного человека. Сочетание огромных объемов цифровых данных и дешевой вычислительной мощности позволяет нам гораздо лучше понимать поведение человека. Представители страховых компаний правильно описывают свой бизнес как «передача риска» – и поэтому им следует как можно точнее оценивать риски, переносимые на них. Особенности бизнеса, которым занимаются такие компании, как Allstate Corporation, заставляют их обращать самое пристальное внимание на вещи, которые стороннему наблюдателю могли бы показаться ничего не значащими случайностями:{39}
• в дорожно-транспортные происшествия со смертельным исходом чаще всего попадают водители в возрасте от двадцати до двадцати четырех лет;
• в штате Иллинойс чаще всего угоняют автомобили марки Honda Civic (а в штате Алабама – полноразмерные пикапы Chevrolet)[28];
• хотя законом запрещена отправка SMS во время вождения, поскольку это часто приводит к ДТП, водителей это не останавливает. Более того, подобные законы могут даже усугублять ситуацию, заставляя водителей прятать мобильные телефоны и в результате отвлекаться от дороги во время набора сообщения.
Компании, выпускающие кредитные карточки, находятся на переднем крае такого анализа, поскольку они знают наши личные данные и покупательские привычки, а их модель ведения бизнеса сильно зависит от умения находить клиентов, кредитный риск (то есть риск неплатежа) которых сравнительно невелик. (Идеальные клиенты с точки зрения кредитного риска, как правило, расточительны, так как каждый месяц полностью оплачивают свои счета; клиенты, располагающие крупными балансами с высокими процентными ставками, генерируют солидные прибыли – пока не окажутся неплатежеспособными.) Одно из самых интересных исследований того, кто, скорее всего, оплатит счет, а кто нет, было выполнено Дж. П. Мартином, любителем математики и одним из сотрудников компании Canadian Tire, крупной сети розничной торговли, специализирующейся на продаже широкого спектра автозапчастей и автомобильных аксессуаров, а также ряда других товаров{40}. Когда Мартин проанализировал каждую транзакцию, выполненную с помощью кредитной карточки Canadian Tire за предыдущий год, оказалось, что покупки, совершенные клиентами в прошлом, являются весьма точным предиктором их будущего «покупательского» поведения, если использовать этот показатель в сочетании с такими традиционными инструментами, как величина дохода и кредитная история.
Статья в The New York Times, озаглавленная «Что знает о вас компания, выпустившая вашу кредитную карточку?», содержала описание некоторых из самых интересных выводов Мартина: «Люди, которые покупают дешевые непатентованные моторные масла, с гораздо большей вероятностью уклонятся от платежей по кредитным карточкам, чем те, кто предпочитает дорогостоящие фирменные товары. Те, кто покупает датчики угарного газа для дома или мягкие войлочные подкладки для ножек стульев и табуреток, чтобы не царапать пол в комнате, почти никогда не увиливают от платежей. Практически каждый, кто купил какой-либо из дешевых автомобильных аксессуаров, впоследствии с большой долей вероятности не оплатит свой счет».