Скрининг
В начале своей статистической карьеры я участвовал в проекте по выявлению
предрасположенности к остеопорозу у женщин. Остеопороз — это патология, при которой
кости теряют массу, становятся хрупкими и с большей вероятностью могут сломаться. По
этой причине падения для пожилых людей могут быть особо опасными. Способы измерения
плотности костей, например центральная двухэнергетическая рентгеновская
абсорбциометрия (центральная DXA), существуют, но они, как правило, очень сложны и
недешевы. Это означает, что нужен процесс, позволяющий идентифицировать людей,
которые могут страдать от этого состояния. Цель проекта состояла в разработке простой
анкеты, которая позволяет получить оценку вероятности возникновения остеопороза на
основе известных факторов риска. При этом анкета должна была заполняться респондентом
самостоятельно без необходимости присутствия специалиста.
Наша анкета, как и другие подобные инструменты скрининга, не могла бы полностью
отделить имеющих предрасположенность от тех, у кого ее нет. Но даже несовершенная
система, способная выявлять большинство тех, кто находится в группе высокого риска, была
бы чрезвычайно ценной. Это позволило бы службам здравоохранения сосредоточить на них
внимание и протестировать с помощью более точной и дорогостоящей процедуры.
Несовершенная система допускает ошибки двух видов. С одной стороны, она может
пропустить того, у кого есть патология, — в нашем примере это кто-то с остеопорозом при
50
отсутствии стандартных признаков. А с другой стороны, система может отнести здорового
человека к имеющим заболевание. Очевидно, что чем ниже уровни ошибок обоих видов, тем
лучше инструмент проверки. Казалось бы, можно снизить частоту ошибок первого вида до
нуля, просто классифицируя всех как подверженных остеопорозу, но это делает скрининг
бесполезным. И что еще хуже, это увеличивает уровень ошибок второго вида: мы
классифицируем всех одинаково без реального выполнения условий. Аналогично мы могли
бы уменьшить уровень ошибок второго вида до нуля, классифицируя всех как не имеющих
предрасположенности, но и это совершенно бессмысленно. Учитывая, что инструмент
несовершенен, нужно было найти какой-то баланс. Или, другими словами, следовало
признать тот факт, что кого-то мы неизбежно будем классифицировать неверно.
Любой, кто окажется по результатам скрининга в группе высокого риска, будет подвергнут
более тщательному обследованию, например с использованием центральной DXA. Среди
этих людей будут и те, кого мы неверно классифицируем как потенциально страдающих
остеопорозом, и в этом случае тест покажет отсутствие заболевания. Но другая группа, к
которой по результатам скрининга будут отнесены не имеющие предрасположенности, не
будет обследоваться так тщательно. Таким образом, мы не узнаем, с кем из этой группы мы
ошиблись, по крайней мере до тех пор, пока их состояние не покажет со всей очевидностью
нашу ошибку. Можно только надеяться (если инструмент скрининга достаточно
эффективен), что таких окажется не слишком много, но их истинное состояние будет для нас
темными данными.
Ошибочная классификация больных людей как здоровых может быть весьма опасна,
особенно в случае потенциально смертельного, но легко поддающегося лечению
заболевания. Однако ошибочная классификация человека в качестве больного, тогда как на
самом деле он здоров, тоже может иметь нежелательные последствия. Например, ошибочные
подозрения на такие серьезные заболевания, как СПИД или рак, способны вызвать
психологические проблемы, даже если впоследствии подозрение будет снято. Кроме того,
это влечет ненужные затраты на проведение более точного обследования. Герд Гигеренцер,
эксперт в вопросах искажения восприятия случайности и статистики, приводит пример с
программами скрининга рака молочной железы11. Он отмечает, что из 1000 женщин,
которые принимают участие в таких программах, около сотни ошибочно направляются на
дальнейшее обследование, подвергаясь инвазивным, неприятным, а порой и болезненным
процедурам. И даже для многих из тех, у кого рак молочной железы все-таки
обнаруживается, ситуация становится только хуже. Как полагает Гигеренцер, «женщины,
имеющие непрогрессирующий или прогрессирующий очень медленно рак молочной железы,
который они сами даже не заметили бы в течение жизни, часто подвергаются лампэктомии,
мастэктомии, токсичной химиотерапии и прочим вмешательствам, которые не приносят им
никакой пользы». Порой кажется, что лучше бы темные данные так и оставались темными.
Оценка эффективности программ скрининга осложняется фактом развития общества. Мы
уже видели, как сказалось на росте числа случаев болезни Альцгеймера то, что люди стали
дольше жить и диагнозы этого заболевания перестали быть темными данными из разряда
«что могло бы случиться, если бы вы жили дольше» и перешли в категорию «что на самом
деле случилось с вами».
Скрининговые программы также чувствительны к такому тонкому проявлению темных
данных, как систематическая ошибка различия длительности течения заболевания. Давайте
проиллюстрируем этот эффект на примере гипотетической ситуации.
Предположим, есть две болезни: одна длится один день, а другая — один год, в течение
которого инфицированные люди живут нормальной жизнью, но в конце каждого из этих
периодов они умирают. Для простоты предположим также, что ежедневно каждой болезнью
заражается один человек. Если мы хотим узнать, сколько людей страдает от этих
51
заболеваний, самым простым (и неправильным!) способом будет взять один день и
посмотреть статистику по нему. Мы обнаружим лишь одного человека с краткосрочной
болезнью — человека, зараженного в этот самый день, но тех, кто болен продолжительным
заболеванием, будет 365 человек — по числу дней в году, на протяжении которого они
заражались. На первый взгляд это будет выглядеть так, словно от продолжительного
заболевания страдает в 365 раз больше людей, чем от краткосрочного. Чтобы увидеть
реальную ситуацию, нам будет не хватать 364 человек, заразившихся краткосрочной
болезнью в течение предыдущего года.
Этот пример может показаться надуманным, но на самом деле при скрининге рака иногда
происходит нечто подобное. Медленно развивающиеся раковые опухоли имеют более
длинную бессимптомную фазу и не влияют на выживаемость организма более
продолжительный период времени. Исследование, которое мы описали выше, выявило бы
больше людей с медленно развивающимся раком, чем с быстро развивающимся. Это привело
бы к ложному представлению о том, насколько эти два вида рака поражают людей в
популяции.
Мы рассмотрели скрининговые программы на примере медицины, где проверяется, болен
или не болен человек, но та же формальная структура описывает и многие другие ситуации.
Ранее в книге я приводил пример кредитного скоринга с целью классификации людей в
зависимости от вероятности того, будут они погашать кредит или нет. Подбор персонала —
еще одна сфера применения скрининга. Заявки подает множество кандидатов, которые
отсеиваются после первичного изучения биографических данных и заполненных анкет.
Кандидаты из короткого списка приглашаются на собеседование. Первичное изучение
выполняет ту же роль, что и инструмент скрининга. Кандидатов, попавших на
собеседование, но не прошедших его, можно рассматривать как ложноположительные
результаты — они казались подходящими на основании резюме, а более глубокий анализ
показал, что это не так. Но нельзя забывать и о тех кандидатах среди отсеянных до
собеседования, которые подошли бы идеально. В медицине такие результаты называются
ложноотрицательными, и, конечно, все это тоже темные данные.
Do'stlaringiz bilan baham: |