Пример 9. (Испытание гипотезы о нормальности распределения). Пользуясь критерием , при уровне надежности установить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с данными выборки объема n=100:
номер
интервала
|
границы
интервала
|
Частота
|
номер
интервала
|
границы
интервала
|
Частота
|
i
|
xi
|
xi+1
|
ni
|
i
|
xi
|
xi+1
|
ni
|
1
|
3
|
8
|
6
|
5
|
23
|
28
|
16
|
2
|
8
|
13
|
8
|
6
|
28
|
33
|
8
|
3
|
13
|
18
|
15
|
7
|
33
|
38
|
7
|
4
|
18
|
23
|
40
|
|
|
|
|
Решение: Найдем середины частичных интервалов ; в качестве частоты варианты примем число вариант, которые попали в i - й интервал. В итоге получим распределение:
Вычислим выборочную среднею и выборочное среднее квадратическое отклонение:
Нормируют случайную величину X, т.е. переходят к случайной величине и вычисляют концы интервалов и .
Вычисляют теоретические вероятности попадания Х в интервалы по равенству:
,
где Ф(z) - интегральная функция Лапласа, значения которой приведены в приложении в таблице №4. Причем наименьшее значение Z, т.е. полагают равным , а наибольшее, т.е. полагают равным .
Например:
Аналогично вычисляются остальные теоретические вероятности. Ниже приведены результаты вычислений:
i
|
границы
интервала
|
Ф (z i)
|
Ф (zi+1)
|
pi = Ф (z i) - Ф (z i+1)
|
|
zi
|
zi=1
|
|
|
|
1
2
3
4
5
6
7
|
-
-1,74
-1,06
-0,37
0,32
1,00
1,69
|
-1,74
-1,06
-0,37
0,32
1,00
1,69
|
-0,5
-0,4591
-0,3554
-0,1443
0,1255
0,3413
0,4545
|
-0,4591
-0,3554
-0,1443
0,1255
0,3413
0,4545
0,5
|
0,0409
0,1037
0,2111
0,2698
0,2158
0,1132
0,0455
|
|
|
|
|
|
|
Найдем значение статистики , для чего составим следующую расчетную таблицу:
i
|
pi
|
npi=100pi
|
ni
|
ni - npi
|
(ni - npi)2
|
|
1
2
3
4
5
6
7
|
0,0409
0,1037
0,2111
0,2698
0,2158
0,1132
0,0455
|
4,09
10,37
21,11
26,98
21,58
11,32
4,55
|
6
8
15
40
16
8
7
|
1,91
-2,37
-6,11
13,02
-5,58
-3,32
2,45
|
3,648
5,617
37,332
169,52
31,136
11,02
6,002
|
0,89
0,54
1,77
6,28
1,44
0,97
1,32
|
|
|
|
|
|
|
|
Нормальное распределение имеет параметра, т.е. , поэтому число степеней свободы . Найдем по таблице №9 (см. Приложение) критических значений распределения значение . Так как , то надежностью 95% отвергается гипотеза НО.
Вывод: Гипотеза о нормальном распределении генеральной совокупности не согласуется с данными выборки.
Задания для закрепления:
(Испытание гипотезы о распределении). Часы, выставленные в витринах часовых мастерских, показывают случайное время. Некто наблюдал показания 500 часов и получил следующие результаты:
i
|
0
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
vi
|
41
|
34
|
54
|
39
|
49
|
45
|
41
|
33
|
37
|
41
|
47
|
39
|
где i - номер промежутка от i -го часа до (i+1) - го, i = 0,1,...,11; а vi - число часов показания которых принадлежали i - ому промежутку. Согласуются ли эти данные с гипотезой Н0 о том, что показания часов равномерно распределены на интервале (0;12)? Принять .
Ответ: Согласуются. .
15. (Испытание гипотезы о нормальности распределения). Распределение числового признака Х в выборке определяется следующей таблицей:
3,0-3,6
|
3,6-4,2
|
4,2-4,8
|
1,8-5,2
|
5,4-6,0
|
6,0-6,6
|
6,6-7,2
|
2
|
8
|
35
|
43
|
22
|
15
|
5
|
При уровне значимости верна ли гипотеза о нормальности распределения Х в генеральной совокупности.
Ответ: согласуются.
16. (Испытание гипотезы о нормальности распределения). Пользуясь критерием , при уровне надежности установить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с данными выборки объема n=100:
номер
интервала
|
границы
интервала
|
Частота
|
номер
интервала
|
границы
интервала
|
Частота
|
i
|
xi
|
xi+1
|
ni
|
i
|
xi
|
xi+1
|
ni
|
1
|
-20
|
-10
|
20
|
5
|
20
|
30
|
40
|
2
|
-10
|
0
|
47
|
6
|
30
|
40
|
16
|
3
|
0
|
10
|
80
|
7
|
40
|
50
|
8
|
4
|
10
|
20
|
89
|
|
|
|
|
Ответ: Согласуется.
17-Занятие. Коэффициент регрессии. Уравнение линейной регрресии.
Линейная регрессия Y на Х имеет вид:
,
где MX, MY - математические ожидания, - средние квадратичные отклонения, - коэффициент корреляции случайных величин X и Y.
Коэффициент называют коэффициентом регрессии Y на Х , а прямую
называют прямой регрессии. Величину называют остаточной дисперсией случайной величины Y относительно случайной величины Х; она характеризует величину ошибки, которую допускают при замене Y линейной функцией . При остаточная дисперсия равна нулю и величины Y и Х связаны линейной функциональной зависимостью.
Аналогично можно получить прямую регрессии Х на Y :
( коэффициент регрессии Х на Y) и остаточную дисперсию величины Х относительно Y.
Если , то обе прямые регрессии и совпадают. Из уравнений регрессии следует, что обе прямые регрессии проходят через точку (MX,MY) - центр рассеивания двумерной случайной величины (Х,Y).
Решение типовых примеров:
Пример 1. Найти уравнение прямой регрессии Y на Х для дискретной двумерной случайной величины (X,Y) из примера 1, §2.7.
Двумерная дискретная случайная величина задана следующим законом распределения:
X
Y
|
x1=2
|
x2=5
|
x3=10
|
y1=1
|
0,30
|
0,10
|
0,10
|
y2=4
|
0,15
|
0,25
|
0,10
|
Решение. Как уже известно законы распределения составляющих Х и Y:
X x1=2 x2=5 x3=10 Y y1=1 y2=4
P 0,45 0,35 0,20 P 0,50 0,50
Математическое ожидание, дисперсию и среднее квадратичное отклонение составляющих Х и Y равны
Найдем коэффициенты ковариации и корреляции
.
.
Коэффициент регрессии Y на Х равен:
и следовательно, уравнение прямой регрессии имеет следующий вид:
или .
Остаточная дисперсия случайной величины Y относительно величины Х равна .
Ответ: ; .
Пример 4. Двумерная случайная величина (X,Y) задана плотностью совместного распределения : в квадрате ; вне этого квадрата f(x,y)=0. Найти уравнение прямой и обратной регрессии .
Решение: Найдем математическое ожидание составляющей Х:
.
и дисперсию:
.
Дважды интегрируя по частям, находим
Аналогично находятся ;
Найдем коэффициент ковариации:
.
Следовательно, коэффициент корреляции равен:
.
Найдем коэффициент прямой регрессии Y на Х:
и уравнение прямой регрессии :
или .
Остаточная дисперсия случайной величины Y относительно случайной величины Х равна: .
Аналогично находим уравнение обратной регрессии Х на Y:
Найдем коэффициент регрессии Х на Y:
и уравнение обратной регрессии ;
.
Остаточная дисперсия случайной величины Х относительно случайной величины Y равна: .
Ответ: Уравнение прямой регрессии:
Уравнение обратной регрессии:
Задания для закрепления:
1. Найти уравнение прямой и обратной регрессии для дискретной двумерной случайной величины из задания 1 настоящего параграфа, т.е. закон распределения случайной величины (X,Y) :
-
X
Y
|
-1
|
0
|
1
|
0
|
0,10
|
0,15
|
0,20
|
1
|
0,15
|
0,25
|
0,15
|
Ответ: уравнение прямой регрессии: ,
остаточная дисперсия ;
уравнение обратной дисперсии: ,
остаточная дисперсия .
4. Найти уравнение прямой и обратной регрессии для дискретной двумерной случайной величины из задания 2 настоящего параграфа, т.е. двумерная случайная величина (X,Y) подчинена закону распределения с плотностью в области D и равна нулю вне той области. Область D - треугольник, ограниченный прямыми .
Ответ: уравнение прямой регрессии: ,
уравнение обратной регрессии: ,
остаточные дисперсии: .
Asosiy adabiyotlar
Ш.Қ. Форманов “Эҳтимолликлар назарияси”, Тошкент “Университет” 2014 й.
И.А.Палий. Прикладная статистика. Учебное пособие. М.: Издательско-торговая корпорация. «Дашков и К», 2010. – 224с.
Гмурман В.Е. «Эҳтимоллар назарияси ва математик статистикадан масалалар ечишга доир қўлланма», Тошкент, «Ўқитувчи», 1980 й.
Do'stlaringiz bilan baham: |