145
не могу зафиксировать, по крайней мере полностью, и установить их значения. Проще
говоря, эти данные — темные.
Учитывая фундаментальную субъективность и неопределенность причин наших
представлений о среднем росте населения, вполне понятна неуверенность, которая может у
нас возникнуть в отношении того, стоит ли что-то утверждать или принимать решения на
основании собственного мнения по этому вопросу. Вместо этого следует собрать данные,
чтобы добиться большей объективности. И это именно то, для чего нужен байесовский
подход к статистике. В соответствии с ним следует взять наши первоначальные мнения о
возможных значениях среднего роста, называемые априорными убеждениями, а затем
корректировать их по мере поступления новых реальных данных, что приводит к появлению
апостериорных убеждений. Мы могли бы, например, измерить рост 100 случайно выбранных
британцев, а затем использовать эти 100 значений, чтобы скорректировать или обновить
наше первоначальное представление о среднем росте населения. Результатом будет новое
распределение возможных значений среднего роста, которое будет представлять собой
смещение первоначального распределения наших мнений в сторону наблюдаемых
фактических значений. Если взять действительно большую выборку, то ее вес в определении
среднего значения будет настолько велик, что влияние нашего первоначального
представления окажется ничтожным. Этот процесс обновления или корректировки
выполняется с использованием фундаментальной теоремы Байеса. С нашей точки зрения,
теорема Байеса объединяет ненаблюдаемые темные данные с реально наблюдаемыми, чтобы
получить новое распределение мнений о вероятном среднем росте. (Ладно, так и быть,
скажу: Национальная статистическая служба Великобритании сообщает, что средний рост
британских мужчин 1,75 м.)
Вот другой пример. Ученые пытались определить скорость света еще в XVII в.: в 1638 г.
Галилей установил, что она по меньшей мере в 10 раз превышает скорость звука; в 1728 г.
Джеймс Брэдли назвал значение 301 000 км/с, а в 1862 г. Леон Фуко скорректировал его до
299 796 км/с. Мы можем суммировать эти и другие оценки, чтобы получить распределение
мнений относительно возможных значений. Подробные результаты экспериментов могут
быть утеряны — стать темными данными, но распределение мнений будет содержать
соответствующую информацию. В конце XIX в. канадский астроном и математик Саймон
Ньюком (тот самый, с которым мы уже встречались, говоря о распределении Бенфорда)
провел дальнейшие эксперименты. В 1891 г. он опубликовал свои измерения, сделанные
между 24 июля 1882 г. и 5 сентября 1882 г., в альманахе Astronomical Papers, издаваемом
Американским офисом Морского альманаха1. Подробные измерения Ньюкома стали
доступны для объединения с темными данными, скрытыми в распределении мнений на
основе более ранних экспериментов, что улучшило это распределение. К слову сказать, на
сегодняшний день наиболее точная оценка скорости света, которую мы имеем, составляет
299 792,458 км/с в вакууме.
Байесовская статистика играет чрезвычайно важную роль — это одна из двух (или по другой
версии трех) основных школ статистического анализа.
Do'stlaringiz bilan baham: