Пример 5.8
На модели объекта проведен однофакторный эксперимент из пяти наблюдений, результаты которого сведены в таблицу (табл. 5.10).
Таблица 5.10
Результаты эксперимента
Фатор и отклики
|
Наблюдение
|
|
1
|
2
|
3
|
4
|
5
|
|
|
0
|
0,5
|
1,0
|
1,5
|
2,0
|
5
|
|
7,0
|
4,8
|
2,8
|
1,4
|
0
|
16
|
|
0
|
2,4
|
2,8
|
2,1
|
0
|
7,3
|
Решение
Примем, что кроме управляемого фактора при проведении эксперимента на объект воздействует случайный фактор, распределенный по нормальному закону с математическим ожиданием . Также предположим, что эта связь – линейная, следовательно, уравнение регрессии нужно определять в виде
.
Неизвестных коэффициентов два: ,Запишем формулу (5.3) в виде двух уравнений для и в каждом из них разложим суммы по индексу i:
Так как , получим
Подставим данные эксперимента из табл. 5.10 в систему (5.4):
Решим систему из двух уравнений и получим . Следовательно, искомое уравнение регрессии
.
Доверительные границы для истинных значений примера 5.8 определяются, как обычно:
,
где – аргумент распределения Стьюдента; – средние квадратические отклонения величинx соответственно.
Значения определяются из таблицы распределения Стьюдента для степеней свободы и достоверности . Пусть , тогда .
где .
Данные для вычисления представлены в табл.5.11
таблица. 5.11
Данные для вычисления
|
|
|
|
|
|
|
|
1
|
0
|
1,0
|
1,00
|
7,0
|
6,68
|
-0,32
|
0,1024
|
2
|
0,5
|
0,5
|
0,25
|
4,8
|
4,94
|
0,14
|
0,0196
|
3
|
1,0
|
0
|
0
|
2,8
|
3,20
|
0,40
|
0,1600
|
4
|
1,5
|
-0,5
|
0,25
|
1,4
|
1,46
|
0,06
|
0,00036
|
5
|
2,0
|
-1,0
|
1,00
|
0
|
0,28
|
0,28
|
0,0784
|
Имеем
Большой размах доверительных границ объясняется малым числом наблюдений в данном эксперименте.
Доверительные границы принимают разные значения в зависимости от значений факторов.
На практике часто ограничиваются обобщенными оценками адекватности построенной модели: величиной среднего абсолютного отклонения
,
или (и) величиной средней квадратической ошибки на единицу веса
.
Весом, или степенью свободы, эксперимента называют разность между числом наблюдений и числом коэффициентов регрессии .
Пример 5.8 (продолжение)
Предположим, что линейная модель недостаточно точно отображает связь между фактором и откликом у.
С уровнем достоверности
Введем в рассмотрение более сложную нелинейную модель
Для определения коэффициентов регрессии обозначим и получим двухфакторную линейную модель
В этом случае уравнение (5.3) раскрывается так:
В уравнениях принято
Так как , то система принимает вид
Подставим значения фактора и отклика из табл. 5.10:
Решим систему из трех уравнений с тремя неизвестными и получим .
Таким образом, получено новое уравнение регрессии
.
По значениям и нетрудно убедиться в том, что нелинейная модель более точно отображает моделируемый процесс (см. табл. 5.10), чем линейная.
В рассмотренном примере ошибка модели определялась по тем же данным, по которым и была определена сама модель. Однако при сокращенных планах экспериментов (см. параграф 4.3) можно выполнить все или часть «сэкономленных» наблюдений для получения так называемых проверочных данных, которые и нужно использовать для вычисления ошибки . В этом случае оценка адекватности модели будет более объективна, хотя число наблюдений в эксперименте увеличивается и экономии их не будет.
По уравнению регрессии можно сделать ориентировочную оценку чувствительности отклика к изменению того или иного фактора. Например, в уравнении влияние фактора на отклик незначительно по сравнению с другими, так как коэффициент намного меньше остальных коэффициентов.
В пакете MS Excel есть функция «Регрессия», которая выполняет регрессионный анализ данных компьютерного эксперимента.
Кроме оценок коэффициентов регрессии функция «Регрессия» выдает и другие результаты регрессионного анализа:
• вычисленные значения откликов у (столбец Предсказанное у);
• разность между вычисленными значениями откликов и измеренными в эксперименте в каждом наблюдении у-у (столбец Остатки);
• средние квадратические ошибки в определении коэффициентов уравнения регрессии Sx (столбец Стандартная ошибка);
• t-статистика – вычисленное по выборке значение критерия Стьюдента для проверки значимости коэффициентов уравнения регрессии (нулевая гипотеза – коэффициент равен нулю);
• средние квадратические ошибки в определении коэффициентов откликов при определенных значениях факторов Sy (столбец Стандартные остатки) и др.
После вычисления коэффициентов регрессии, представленной в виде линейного полинома, оценивается их значимость для определения степени влияния различных факторов на значение функции отклика. Основой оценки значимости коэффициентов является сопоставление абсолютного значения, например, коэффициента bi, и дисперсии ошибки его определения . В этом случае с помощью t-критерия проверяется гипотеза о незначимости рассматриваемого коэффициента, т.е. гипотеза о том, что bi = 0 (проверка нуль-гипотезы). При подсчете экспериментального значения t-статистики в числитель ставится абсолютное значение рассматриваемого коэффициента, а в знаменатель – дисперсия ошибки его определения:
Коэффициент bi признается незначимым, если ti для числа степеней свободы N по модулю меньше tkp, найденного из таблицы распределения Стьюдента для заданной достоверности а.
Проверяется адекватность вторичной модели, т.е. ее соответствие результатам эксперимента. Это значит, что в некоторой подобласти, в которую входят и координаты выполненных наблюдений, предсказанное с помощью вторичной модели значение отклика не должно отличаться от значения эксперимента более чем на некоторую заранее заданную величину. Для проверки адекватности достаточно оценить отклонение предсказанного значения отклика от результатов эксперимента в соответствующей точке факторного пространства.
При анализеадекватности уравнения регрессии (вторичной модели) исследуемому процессу возможны следующие варианты.
1. Построенная модель на основе F-критерия Фишера в целом адекватна и все коэффициенты регрессии значимы. Такая модель может быть использована для принятия решений и осуществления прогнозов.
2. Модель по F-критерию Фишера адекватна, но часть коэффициентов не значима. Модель пригодна для принятия некоторых решений, но не для прогнозов.
3. Модель по F-критерию адекватна, но все коэффициенты регрессии не значимы. Модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.
Вопросы и задания для самоконтроля
1. Что понимают под характеристиками случайных величин и процессов?
2. Что такое несмещенная оценка характеристики случайной величины; состоятельная; эффективная?
3. Что характеризует гистограмма? Каково правило построения гистограммы?
4. В чем состоит сущность дисперсионного анализа?
5. Что такое ошибки первого и второго рода при оценке гипотез?
6. Что такое F-распределение и почему оно является мерой сравнения дисперсий случайных величин?
7. Для чего используется критерий Вилкоксона?
8. В чем состоит методика выявления несущественных (незначимых) факторов?
9. Каково назначение корреляционного анализа?
10. Каково назначение регрессионного анализа?
11. Представьте графически виды корреляции между двумя переменными.
12. Составьте систему уравнений для определения коэффициентов регрессии модели вида .
13. Для линейной и нелинейной моделей, полученных в предыдущем задании, вычислите и сравните ошибки и .
14. Как проверяется значимость коэффициентов регрессии?
Do'stlaringiz bilan baham: |