План лекции: - Способы изучения корреляционных зависимостей.
- Определение коэффициента парной линейной корреляции.
- Этапы регрессионного анализа
- Уравнение регрессии
- Метод наименьших квадратов
- Оценка качества уравнения регрессии
ВИДЫ ЗАВИСИМОСТЕЙ
Функциональная
Корреляционная
При функциональных зависимостях каждому
значению одной переменной величины соответствует
одно вполне определенное значение другой
переменной (функции).
Корреляционные (статистические) связи
характеризуются тем, что численному
значению одной переменной соответствует много
значений (распределение) другой переменной.
Изучение корреляционных зависимостей
№
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
Х
(рост)
|
158
|
161
|
166
|
170
|
174
|
178
|
166
|
174
|
170
|
у(вес)
|
59
|
60
|
61
|
65
|
70
|
69
|
63
|
65
|
67
| Табличный метод - Табличный метод
б) для большого количества измерений
х
у
|
18
|
22
|
26
|
30
|
70
|
5
| | | |
75
|
7
|
46
|
1
| |
80
| |
29
|
72
| |
85
| | |
29
|
8
|
90
| | | |
3
| Графический метод - Аналитический метод
( в виде математической формулы)
У
У
Х
Х
r=0
r=+0,5
ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА - Определение тесноты (степени сопряженности) между варьируемыми признаками
- Определение формы и направления связи
КОРРЕЛЯЦИЯ бывает: положительной (прямой) и отрицательной (обратной) По форме – линейной и нелинейной.
ковариация
для выборки из
n опытов
коэффициент корреляции
так как
и
то
На практике коэффициент корреляции считают по
формуле:
Коэффициент корреляции является безразмерной характеристикой, которая используется в качестве меры линейной зависимости случайных величин. Коэффициент корреляции является безразмерной характеристикой, которая используется в качестве меры линейной зависимости случайных величин. Одним из подходов к интерпретации корреляции является вычисление доли объясняемой дисперсии, т.е. доли вариабельности одного признака, зависящего от вариабельности второго признака. Эта мера вычисляется по формуле: r2 100 (%). Если - r < 0,3 – связь слабая;
- 0,3 ≤ r ≤ 0,75 – связь умеренная;
- 0,75 ≤ r < 1 – связь сильная;
- r = 0 – связь отсутствует;
- r = 1 – связь функциональная.
Пример: Определить наличие связи между величиной годовой прибыли (Y) и затратами на функционирование (Х) аптеки за 5 лет. Оценить достоверность полученных результатов.
X
|
6
|
3
|
7
|
5
|
10
|
Y
|
33
|
22
|
32
|
28
|
42
| График зависимости годовой прибыли от затрат аптеки
N
|
Xi
|
Yi
|
Xi Yi
|
(Xi)2
|
(Yi)2
|
1
|
3
|
22
|
66
|
9
|
484
|
2
|
5
|
28
|
140
|
25
|
784
|
3
|
6
|
33
|
198
|
36
|
1089
|
4
|
7
|
32
|
224
|
49
|
1024
|
5
|
10
|
42
|
420
|
100
|
1769
|
Σ
|
31
|
157
|
1048
|
219
|
5145
| |
B
|
C
|
A
|
D
|
E
| |
961
|
24649
| | | |
r > 0,9 – связь сильная r2=96%
Полученный коэффициент корреляции является выборочным, поэтому он имеет свою ошибку – “ошибку” выборочности. Эта ошибка является мерой расхождения между коэффициентом корреляции выборки (r) и коэффициентом корреляции генеральной совокупности (обозначим его ). Согласно нулевой гипотезе предполагается, что в генеральной совокупности нет связи между варьирующими признаками (=0). Тогда критерий нормированного отклонения:
Для малых выборок (n<30) ошибку коэффициента корреляции sr можно определить по формуле:
t0.95;3=3,18
tэксп > tтабл нулевая гипотеза отвергается, связь достоверна, т.е. с увеличением затрат увеличивается и годовая прибыль аптеки.
где n-число пар измерений
КОРРЕЛЯЦИЯ РАНГОВ rp - коэффициент Спирмена для непараметрических показателей. d=xρ- yρ ; n – объем выборки.
Коэффициент достоверности (для числа пар рангов больше 9):
Р
|
n=5
|
n=6
|
n=7
|
n=8
|
n≥9
|
0,95
|
1
|
0,89
|
0,75
|
0,71
| |
0,99
| |
1
|
0,84
|
0,86
| |
0,999
| | | | | |
Вывод: с вероятностью большей 0,95 можно сказать, что между окрасом лис и их агрессивностью существует прямая положительная связь
Этапы регрессионного анализа - Метод регрессии позволяет установить, как количественно меняется один признак при изменении другого на единицу.
Этапы регрессионного анализа: - выбор формы зависимости (типа уравнения);
- вычисление коэффициентов выбранного уравнения;
- оценка достоверности полученного уравнения.
Уравнение регрессии - Уравнением регрессии у по х называется уравнение вида = f(х), устанавливающее зависимость между значениями независимой переменной х и условными средними зависимой переменной .
- Для линейной регрессии зависимость между х и у выражается уравнением: у = а + bx,
где b характеризует скорость изменения зависимой переменной у при изменении переменной х (b=tg ); a – начальная ордината, определяет значение у при х = 0.
У=а+bх
у
х
а
φ
График линейной зависимости
Коэффициент b называется
коэффициентом линейной регрессии
МЕТОД НАИМЕНЬШИХ КВАДРАТОВ где уi – экспериментальные точки; у(хi) – зависимость у(хi)=а+bхi Для определения коэффициентов а и b необходимо решить систему линейных уравнений: Для определения коэффициентов а и b необходимо решить систему линейных уравнений:
Решение этой системы:
ПРИМЕР: В 100 частях воды растворяется следующее число условных частей азотнокислого натрия NaNO3 (у) при соответствующих температурах (х).
NaNO3 (y)
|
56
|
71
|
76
|
81
|
86
|
Tº (x)
|
0
|
4
|
10
|
15
|
21
| Зависимость содержания NaNO3 от Tº
Эмпирическая кривая регрессии
Расчет коэффициентов уравнения регрессии
xi
|
yi
|
yi xi
| |
0
|
56
|
0
|
0
|
4
|
71
|
284
|
16
|
10
|
76
|
760
|
100
|
15
|
81
|
1215
|
225
|
21
|
86
|
1806
|
441
|
| | | |
50
|
370
|
4065
|
782
|
A
|
B
|
C
|
D
| Коэффициенты регрессии:
Уравнение регрессии: Y=61,1+1,29*X
Построим теоретическую линию регрессии: Построим теоретическую линию регрессии: при х=0, y=61,1+1,29*0=61,1 при х=10, y=61,1+1,29*10=74 Уравнение регрессии позволяет вычислять теоретические (вероятные) значения зависимой переменной по заданным значениям независимых переменных в области их изменения. Как правило, оно применяется только внутри этой области. Рассчитаем содержание NaNO3 при Т=18º С Y=61,1+1,29*18=84,4 Так как уравнение регрессии определялось нами на основе выборочной совокупности, оно может в той или иной мере представлять уравнение истинной регрессии в генеральной совокупности. - Так как уравнение регрессии определялось нами на основе выборочной совокупности, оно может в той или иной мере представлять уравнение истинной регрессии в генеральной совокупности.
- Коэффициенты а и b, как и другие статистические параметры, имеют ошибки выборочности. Поэтому необходимо доказать статистическую значимость полученных коэффициентов регрессии или уравнения регрессии.
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: Основная литература: - Павлушков И.В. Основы высшей математики и математической статистики. М., ГЭОТАР-Медиа, 2005, с.289-320.
Учебно–методические пособия: - Шапиро Л.А., Шилина Н.Г. Руководство к практическим занятиям по медицинской и биологической статистике Красноярск: ООО «Поликом». – 2003.
Do'stlaringiz bilan baham: |