Погрешности невыясненной природы – это погрешности, значения которых неизвестны, трудно выявить и исключить. Их можно обнаружить лишь после устранения прочих систематических погрешностей и последующего тщательного исследования всех стадий, операций и условий проведения анализа. Обычно в таких случаях исполь-
зуют прием рандомизации (от англ. random – случайно) – переведение систематических погрешностей в разряд случайных. Возможность рандомизации основана на том, что систематическая погрешность единичного явления (метода, прибора, исполнителя анализа) при рассмотрении ее в более широком классе однотипных явлений (группа методов, серия приборов, коллектив аналитиков) становится величиной переменной, т. е. приобретает черты случайной погрешности и оценивается с применением методов математической статистики.
2.3. Статистическая обработка результатов прямых
равноточных наблюдений (определений)
Все измерения в метрологии делятся на прямые и косвенные.
При прямых непосредственных измерениях числовое значение измеряемой величины х получают непосредственным сравнением этой величины с эталоном (например, массы предмета при взвешивании на чашечных весах – с массой разновесок, объема раствора – с проградуированной шкалой бюретки и т. п.). Обычно результаты таких измерений получают сразу из показаний измерительного прибора.
Результат каждого прямого измерения включает случайную погрешность, которая зависит от большого числа случайных факторов.
Если отклонения, вызванные случайными факторами, сравнимы по абсолютному значению с чувствительностью прибора, то они обнаруживаются приборами, и при n измерениях одной и той же величины получаются результаты x1, x2, xi, xn, которые могут отличаться друг от друга в пределах чувствительности данных измерений.
В описание результатов, полученных при параллельных (replicate) измерениях (определениях), следует включать следующие характеристики: число измерений, среднее арифметическое, стандартное отклонение, границы доверительного интервала и, если известно, истинное значение, а также оценку границ систематической погрешности.
Число измерений (number of observations, n) – общее число полученных данных в серии, объем выборки (sample size). Это число необходимо указывать всегда. В случае, если рассматривается генеральная совокупность, используют обозначение N.
Число степеней свободы (degrees of freedom, f) – статистическая величина, показывающая число переменных, которые могут быть присвоены произвольно при характеристике выборки; в наиболее простом случае, когда имеют n измерений (определений) и один исследуемый параметр (среднее значение) – f = n – 1.
Уровень доверительной вероятности (confidence level), или доверительная вероятность, – вероятность того, что ожидаемая величина исследуемого параметра лежит внутри некоторого интервала (P = 1 – α). Доверительная вероятность (Р) – доля случаев, в которых среднее (х) при данном числе определений будет лежать в определенных пределах. Доверительная вероятность связана с двусторонней – верхней и нижней – границей разброса среднего значения выборки. С точки зре-
ния математической статистики надежность полученного результата тем выше, чем больше доверительная вероятность. Как правило, поль-
зуются доверительной вероятностью Р, равной 0,95, или двухсигмовым критерием (2σ), но в особо важных случаях принимают Р = 0,99 – критерий 3σ. Доверительная вероятность может быть выражена и в процентах.
Комплементарная величина α известна как уровень значимости (significance level). Уровень значимости α = (1 – Р) – максимальная вероятность того, что погрешность превзойдет некое предельное (критическое) значение (+Δхкр), т. е. такое значение, что появление этой погрешности можно рассматривать как следствие значимой (неслучайной) причины. В разных литературных источниках уровень значимости обозначается по-разному: α, β.
Среднее арифметическое, средняя величина (arithmetic mean, average, ) – сумма всех значений серии (выборки) наблюдений, деленная на число наблюдений:
(2.13)
Во всех процессах определения суммы (здесь и далее, если это не оговорено особо) пределы суммирования рассматриваются от 1 до n.
Отклонение (deviation, d) – разность между случайной величиной и арифметическим средним выборки, к которой она принадлежит:
(2.14)
Размах (выборки) (range, R) – разность между наибольшей и наименьшей из наблюдаемых величин в выборке:
R = xmax – хmin. (2.15)
Этот параметр особенно удобен для малых выборок (n < 10) как альтернативная мера дисперсии.
Стандартное отклонение (standard deviation) оценивается как положительный квадратный корень величины, получаемой при делении суммы квадратов разностей всех элементов выборки и среднего этой выборки на число степеней свободы (в простейшем случае – число измерений минус единица). Выражается выборочное стандартное отклонение (estimated standard deviation, S) следующей формулой:
(2.16)
Относительное стандартное отклонение (relative standard deviation, Sr) – стандартное отклонение, деленное на среднее выборки:
(2.17)
Относительное стандартное отклонение, выраженное в процентах (percentage standard deviation, Sr (%)), получают умножением величины относительного стандартного отклонения на 100.
Рекомендуется при описании результатов использовать относительное стандартное отклонение, не выраженное в процентах, во избежание путаницы в том случае, когда результаты также выражены в процентах. Термин коэффициент вариации (coefficient of variation) вместо термина относительное стандартное отклонение использовать не рекомендуется.
Дисперсия (variance, ) – это квадрат стандартного отклонения, выражающийся формулой
(2.18)
При оценке воспроизводимости полученных результатов вычисляют также дисперсию среднего (выборки) по формуле
(2.19)
и стандартное отклонение среднего ( ):
(2.20)
Для обозначения стандартного отклонения среднего в англоязычной литературе используется термин population standard deviation, или стандартная погрешность (standard error), с символом «σ».
Do'stlaringiz bilan baham: |