Рис. 5.5. Могила преподобного Томаса Байеса.
Томас Байес похоронен на кладбище Банхилл-Филдс в центре Лондона. В XVIII веке на этом кладбище хоронили нонконформистов122, но теперь это общественный парк. Могила была отреставрирована в 1969 году, на средства "статистиков со всего мира".
Но в последние 10 лет Томас Байес стал суперзвездой. В сети есть множество сайтов, где объясняется теорема Байеса и сообщается: "Главное, что Байес крут, а кто не знает Байеса, тот не крут". А если вы не верите тому, что говорят в интернете, то, быть может, вас убедит New York Times за 20 января 2004 года?
"В научной среде байесовская революция вот-вот станет преобладающей точкой зрения, что 10 лет назад казалось немыслимым", – говорит Брэдли Карлин, профессор здравоохранения из Университета Миннесоты.
Из-за чего же возник весь этот ажиотаж?
Вот как формулируется теорема Байеса:
p(A|X) = p(X|A)·p(A)/p(X) .
Возьмем некоторое явление (А ), о котором мы хотим узнать, и наблюдение (X ), которое дает нам какие-то сведения об A . Теорема Байеса говорит нам, насколько увеличится наше знание об A в свете новых сведений X . Нам незачем вникать в детали этого уравнения. Главное – что это уравнение дает нам именно ту математическую формулу убеждений, которую мы искали. Убеждению в данном случае соответствует математическое понятие вероятности. Вероятность позволяет измерить, в какой степени я убежден в чем-то. Если я в чем-то совершенно уверен (например, в том, что утром взойдет солнце), вероятность равна единице [в форме уравнения это можно выразить так: p (взойдет солнце) = 1]. А если я совершенно уверен, что что-то никогда не случится, вероятность равна нулю [p (Крис Фрит выиграет конкурс "Евровидение") = 0]. Большинство наших убеждений не так тверды и занимают промежуточное положение между нулем и единицей [p (поезд, на котором я езжу на работу, опоздает) = 0,5]. И эти промежуточные убеждения постоянно изменяются по мере того, как мы получаем новые сведения. Прежде чем ехать на работу, я уточню положение поездов Лондонского метро в интернете, и эти новые сведения изменят мое убеждение о вероятности опоздания поезда (хотя и ненамного...).
Теорема Байеса показывает, насколько именно изменится мое убеждение относительно A в свете новых сведений X . В приведенном выше уравнении p(A) – мое первоначальное или априорное, убеждение об A до поступления новых сведений X , p(X|A) – вероятность получения сведений X в случае, если A действительно будет иметь место, а p(A|X) – мое последующее, или апостериорное, убеждение об A с учетом новых сведений X . Все это станет понятнее на конкретном примере.
Вас, вероятно, удивило, почему это Брэдли Карлин, профессор здравоохранения из Университета Миннесоты, так интересуется теоремой Байеса. Дело в том, что здравоохранение – одна из тех многих областей, где теорема Байеса находит свое применение.
Рассмотрим проблему рака груди.123 Обратимся к частному случаю, связанному с эффективностью массовых обследований. Мы знаем (это наше априорное убеждение), что к 40 годам у 1% женщин развивается рак груди (p(A) = 0,01). Кроме того, у нас есть хороший метод выявления рака груди – маммография (этот метод дает нам новые сведения). Результат маммографии будет положительным у 80% женщин с раком груди (p(X|A) = 0,8) и лишь у 9,6% женщин без рака груди (p(X|~A) = 0,096). Таковы вероятности получения наших сведений в случае, если наше убеждение истинно. Судя по этим цифрам, кажется очевидным, что регулярные обследования на предмет наличия рака груди – вещь хорошая. Итак, если мы обследуем всех женщин, то какова будет среди тех, у кого обследование даст положительный результат, доля тех, у кого действительно будет рак груди, то есть каково будет значение p(A|X) ?
Учитывая, что этот метод кажется хорошим, каково будет ваше убеждение относительно женщины, для которой только что получен положительный результат маммографического обследования на рак груди? Большинство людей сказали бы, что у нее, скорее всего, рак груди. Но применение теоремы Байеса показывает, что это мнение ошибочно. Мы можем легко убедиться в этом, если на время забудем о вероятностях. Вместо этого давайте рассмотрим 10 000 женщин в возрасте 40 лет и старше.
Еще до обследования эти 10 000 женщин можно мысленно разделить на две группы:
Группа 1: 100 женщин с раком груди;
Группа 2: 9900 женщин без рака груди.
Do'stlaringiz bilan baham: |