Корреляционный анализ



Download 21,81 Kb.
Sana21.11.2022
Hajmi21,81 Kb.
#869370
TuriЛекции
Bog'liq
Основы корреляционного и регрессионного анализа

Основы корреляционного и регрессионного анализа

План лекции:

  • Способы изучения корреляционных зависимостей.
  • Определение коэффициента парной линейной корреляции.
  • Этапы регрессионного анализа
  • Уравнение регрессии
  • Метод наименьших квадратов
  • Оценка качества уравнения регрессии

ВИДЫ ЗАВИСИМОСТЕЙ
Функциональная
Корреляционная
При функциональных зависимостях каждому
значению одной переменной величины соответствует
одно вполне определенное значение другой
переменной (функции).
Корреляционные (статистические) связи
характеризуются тем, что численному
значению одной переменной соответствует много
значений (распределение) другой переменной.

Изучение корреляционных зависимостей




1

2

3

4

5

6

7

8

9

Х
(рост)

158

161

166

170

174

178

166

174

170

у(вес)

59

60

61

65

70

69

63

65

67

Табличный метод

  • Табличный метод
  • б) для большого количества измерений


х
у

18

22

26


30

70

5

75

7

46

1

80

29

72

85

29

8

90

3

Графический метод

  • Графический метод
  • Аналитический метод

  • ( в виде математической формулы)

У
У
Х
Х
r=0
r=+0,5

ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА

  • Определение тесноты (степени сопряженности) между варьируемыми признаками
  • Определение формы и направления связи
  • КОРРЕЛЯЦИЯ бывает: положительной (прямой) и отрицательной (обратной)

    По форме – линейной и нелинейной.

Нахождение коэффициента корреляции


ковариация
для выборки из
n опытов
коэффициент корреляции
так как
и
то
На практике коэффициент корреляции считают по
формуле:

Коэффициент корреляции является безразмерной характеристикой, которая используется в качестве меры линейной зависимости случайных величин.

Коэффициент корреляции является безразмерной характеристикой, которая используется в качестве меры линейной зависимости случайных величин.

Одним из подходов к интерпретации корреляции является вычисление доли объясняемой дисперсии, т.е. доли вариабельности одного признака, зависящего от вариабельности второго признака. Эта мера вычисляется по формуле: r2 100 (%).

Если

  • r < 0,3 – связь слабая;
  • 0,3 ≤ r ≤ 0,75 – связь умеренная;
  • 0,75 ≤ r < 1 – связь сильная;
  • r = 0 – связь отсутствует;
  • r = 1 – связь функциональная.

Пример: Определить наличие связи между величиной годовой прибыли (Y) и затратами на функционирование (Х) аптеки за 5 лет. Оценить достоверность полученных результатов.


X

6

3

7

5

10

Y

33

22

32

28

42

График зависимости годовой прибыли от затрат аптеки


N

Xi

Yi

Xi Yi

(Xi)2

(Yi)2

1

3

22

66

9

484

2

5

28

140

25

784

3

6

33

198

36

1089

4

7

32

224

49

1024

5

10

42

420

100

1769

Σ

31

157

1048

219

5145

B

C

A

D

E

961

24649

r > 0,9 – связь сильная r2=96%
Полученный коэффициент корреляции является выборочным, поэтому он имеет свою ошибку – “ошибку” выборочности. Эта ошибка является мерой расхождения между коэффициентом корреляции выборки (r) и коэффициентом корреляции генеральной совокупности (обозначим его ). Согласно нулевой гипотезе предполагается, что в генеральной совокупности нет связи между варьирующими признаками (=0). Тогда критерий нормированного отклонения:

Для малых выборок (n<30) ошибку коэффициента корреляции sr можно определить по формуле:


t0.95;3=3,18
tэксп > tтабл нулевая гипотеза отвергается, связь достоверна, т.е. с увеличением затрат увеличивается и годовая прибыль аптеки.
где n-число пар измерений

КОРРЕЛЯЦИЯ РАНГОВ

rp - коэффициент Спирмена для непараметрических показателей.

d=xρ- yρ ; n – объем выборки.


Коэффициент достоверности (для числа пар рангов больше 9):

Р

n=5

n=6

n=7

n=8

n≥9

0,95

1

0,89

0,75

0,71

0,99

1

0,84

0,86

0,999

Вывод: с вероятностью большей 0,95 можно сказать, что между окрасом лис и их агрессивностью существует прямая положительная связь

Этапы регрессионного анализа

  • Метод регрессии позволяет установить, как количественно меняется один признак при изменении другого на единицу.
  • Этапы регрессионного анализа:

  • выбор формы зависимости (типа уравнения);
  • вычисление коэффициентов выбранного уравнения;
  • оценка достоверности полученного уравнения.

Уравнение регрессии

  • Уравнением регрессии у по х называется уравнение вида = f(х), устанавливающее зависимость между значениями независимой переменной х и условными средними зависимой переменной .
  • Для линейной регрессии зависимость между х и у выражается уравнением: у = а + bx,
  • где b характеризует скорость изменения зависимой переменной у при изменении переменной х (b=tg );

    a – начальная ордината, определяет значение у при х = 0.


У=а+bх
у
х
а
φ
График линейной зависимости
Коэффициент b называется
коэффициентом линейной регрессии

МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

где уi – экспериментальные точки;

у(хi) – зависимость у(хi)=а+bхi

Для определения коэффициентов а и b необходимо решить систему линейных уравнений:

Для определения коэффициентов а и b необходимо решить систему линейных уравнений:


Решение этой системы:

ПРИМЕР: В 100 частях воды растворяется следующее число условных частей азотнокислого натрия NaNO3 (у) при соответствующих температурах (х).


NaNO3 (y)

56

71

76

81

86

(x)

0

4

10

15

21

Зависимость содержания NaNO3 от Tº


Эмпирическая кривая регрессии

Расчет коэффициентов уравнения регрессии


xi

yi

yi xi

0

56

0

0

4

71

284

16

10

76

760

100

15

81

1215

225

21

86

1806

441



50

370

4065

782

A

B

C

D

Коэффициенты регрессии:


Уравнение регрессии: Y=61,1+1,29*X

Построим теоретическую линию регрессии:

Построим теоретическую линию регрессии:

при х=0, y=61,1+1,29*0=61,1

при х=10, y=61,1+1,29*10=74

Уравнение регрессии позволяет вычислять теоретические (вероятные) значения зависимой переменной по заданным значениям независимых переменных в области их изменения. Как правило, оно применяется только внутри этой области. Рассчитаем содержание NaNO3 при Т=18º С

Y=61,1+1,29*18=84,4

Так как уравнение регрессии определялось нами на основе выборочной совокупности, оно может в той или иной мере представлять уравнение истинной регрессии в генеральной совокупности.

  • Так как уравнение регрессии определялось нами на основе выборочной совокупности, оно может в той или иной мере представлять уравнение истинной регрессии в генеральной совокупности.
  • Коэффициенты а и b, как и другие статистические параметры, имеют ошибки выборочности. Поэтому необходимо доказать статистическую значимость полученных коэффициентов регрессии или уравнения регрессии.

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА:

Основная литература:

  • Павлушков И.В. Основы высшей математики и математической статистики. М., ГЭОТАР-Медиа, 2005, с.289-320.
  • Учебно–методические пособия:

  • Шапиро Л.А., Шилина Н.Г. Руководство к практическим занятиям по медицинской и биологической статистике Красноярск: ООО «Поликом». – 2003.

Download 21,81 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish