Коэффициент вариации (обозначим V) представляет собой отношение среднего квадратичного отклонения к средней арифметической, выраженное в процентах, т. е.
Коэффициент вариации позволяет: 1) сравнивать вариацию одного и того же признака у разных групп объектов, 2) выявить степень различия одного и того же признака у одной и той же группы объектов в разное время, 3) сопоставить вариацию разных признаков у одних и тех же групп объектов.
Пример 6. Проведем сравнительный анализ затрат труда и различия в затратах труда в совхозах и колхозах по данным табл. 9 Она содержит исходные данные и промежуточные вычисления
Написать табл. Стр. 96
Используя формулы средней арифметической, среднего квадратичного отклонения и коэффициента вариации, получим: для совхозов-х = 0,6; σ=0,4786; V=79,8%; для колхозов- =1,6; σ=1,489; V =79,8%.
Следовательно, в среднем по РСФСР затраты труда в совхозах примерно в 2,7 раза ниже, чем в колхозах (0,6/1,6), а различия между районами РСФСР в
затратах труда в зерновом производстве в колхозах выше, чем в совхозах, т. е. совхозы составляют более однородную совокупность по затратам труда, чем колхозы.
Нормальное распределение. Если уменьшать интервалы и одновременно увеличивать число наблюдений в них, то гистограмма распределения будет все более приближаться к плавной линии. Кривая, к которой стремится график при указанном преобразовании, называется кривой распределения.
Формы кривых распределения разнообразны. Мы ограничимся рассмотрением одного важного в теоретико-прикладном плане распределения, так называемого нормального распределения.
График нормального распределения (рис. 6) представляет собой симметричную одновершинную кривую, напоминающею по форме колокол. Форма нормальной кривой и положение ее на оси абсцисс полностью определяются двумя параметрами - средним арифметическим значением и средним квадратическим отклонением σ. На рисунке видно, что наиболее часто встречаются варианты, близкие к , а по мере удаления от варианты встречаются все реже. (Ординаты точек графика на рис. 6 обобщают введенное р анее понятие плотности распределения.)
Каждому значению признака х соответствует при этом определенное значение так называемой функции распределения F(x), показывающее, какова вероятность существования вариант, меньших данного значения х. Геометрически вероятность вариант, меньших х, изображается площадью под кривой слева от точки х. Площадь под всей кривой равна 1, что соответствует полной достоверности (т. е. вероятности того, что признак примет вообще какое-то значение). Таким образом, видно, что функция распределения F(x) обобщает понятие накопленной частоты вариационного ряда.
Ввиду своей важности для практических приложений функция нормального распределения табулирована, т. е. имеются таблицы, где каждому значению х ставится в соответствие вероятность F(x) существования значений, меньших х. Для удобства табулирования в качестве значений признака берутся не сами величины х, а так называемые нормированные отклонения их от среднего значения, где .
При замене х на t центр распределения смещается в точку 0, а единицей измерения становится величина среднего квадратического отклонения σ, но вид кривой распределения неизменяется). Среднее значениенормированного отклонения t равно нулю, аего среднее квадратическое отклонениеравно е динице (рис. 7).
Нормированная функциянормального распределения обладаетследующими свойствами: . В табл. 7 приложения приведены значения F(t) дляположительных значений t. Так, для t=2F(t)=0,97725. На рис. 7 площадь, соответствующая этойвероятности,заштрихована.
Вомногих задачах приходится определятьвероятность того, что нормированноеотклонение не превысит по модулю некоторойвеличины t, т. е. значения признака хотклоняются от своего среднего не более чемна tσ.Это вероятность обозначается Ф(t) и равна F(t)-F(-t)=2F(t)-1.Чаще всего на практике используется именновероятность Ф(t),поэтому в табл. 1 приложения табулированызначения Ф(t).Найдем, например, вероятность того, чтонормированное отклонение по модулю непревышает 2, другими словами, значенияпризнака х отличаются от своего среднего помодулю не более чем на . По табл. 1 приложения величине t=2соответствует Ф(t) =0,9545, т. е. примерно в 95случаях из 100 значения признака отклоняютсяот своего среднего не более чем на 2σ.
Прииспользовании статистических методовчасто возникает задача проверкинормальности распределения (см, гл. 9),поскольку нормальность являетсясущественным условием их корректногоприменения.
Do'stlaringiz bilan baham: |