§1. Основные понятия математической статистики. Задачи проверки статистических гипотез.
Теория вероятностей и ее раздел связанный с
случайными величинами, их распределениями, характеристиками и т.п. представляют собой область математики, имеющая свойство быть интерпретированной для получения статистических выводов из эмпирических данных. Рассмотрим, как это происходит.
Рассмотрим
случайный эксперимент, связанный с одномерной случайной величиной X. Осуществив
n независимых повторений эксперимента, мы получим последовательность
n наблюденных
значений величины X, которую обозначают [1]. То множество, откуда извлекаются эти значения (выбор случаен, независим, выбранный элемент возвращается) называется генеральной совокупностью, а извлеченные элементы – выборкой из этой генеральной совокупности. Если известна F(x) - функция распределения
случайной величины, образующей генеральную совокупность, то выборка называется выборкой из распределения, соответствующего F(x).
Выборку можно представлять себе,
как набор точек на оси x. Если каждой точке приписать массу 1/
n, то можно ввести дискретное распределение, ее функция распределения является ступенчатой функцией со скачками высотой 1/
n в каждой точке . Если обозначить через число выборочных значений, не превосходящих x, то функция распределения определяется так:
.
Для определенного таким образом распределения с функцией можно вычислять различные характеристики: среднее,
дисперсию, среднее квадратическое отклонение (СКО) и многие другие. Их следует отличать от соответствующих характеристик исходной случайной величиной X (их называют теоретическими характеристиками), которая образовала генеральную совокупность. Важнейшая задача математической статистики состоит в том, чтобы прояснить взаимосвязь между теоретическими и эмпирическими значениями характеристик.
Природа самой выборки сильно зависит от того, в какой прикладной науке происходит исследование. Для социолога «элемент выборки» – человек, высказывающий значение (не обязательно числовое!) некоторой своей личной характеристики (возраст, зарплата, степень удовлетворенности жизнью), для педагога – оценка (все спорят: это число или нет!) ученика, полученная на
контрольной или экзамене, для медика – температура больного человека. Для практика, профессионала в своей сфере деятельности, – числовой результат некоторого,
возможно, весьма дорогостоящего эксперимента.
Мы в данном случае играем роль математика, для которого элемент выборки есть просто число, обладающее,
как подозревается, определенными характеристиками. По значениям полученной выборки требуется определить так это или нет, то есть обладает это число заявленными характеристиками или нет.