x
i
(j)
– значение
j
-го анализируемого признака (
j
= 1,...
,p)
, ха-
рактеризующего состояние
i
-го объекта. Тогда каждая
i
-я строка мат-
рицы отражает значения
р
признаков, характеризующих
i
-й объект.
2)
обучающие выборки
q
X
X
X
,...,
,
2
1
(5.39)
Каждая выборка
X
k
(
k
=1, 2,...,
q
) определяет значения анализи-
руемых признаков на
n
k
объектах, о которых априори известно, что
все они принадлежат
k
-му классу. Число
q
различных выборок (5.39)
43
Годин А.М. Статистика: Учебник / А.М. Годин.
10-е изд. Перераб. И исправ.
М.: Издательско-торговая
корпорация «Дашков и Ко», 2012.
452 с.
170
равно общему числу всех возможных классов. Следовательно, каж-
дый класс представлен своей совокупностью выборочных данных.
Если при исследовании на «входе» задачи имеются как класси-
фицируемые данные (1), так и обучающие выборки (2), то решается
задача классификации с обучающими выборками («классификация с
учителем). Если обучающие выборки отсутствуют, то речь идет о за-
даче «классификации без учителя».
Выходной результат может быть двух видов:
1.
Если число классов и их сущность заранее определены, то каж-
дому из
классифицируемых объектов должен быть присвоен номер
класса, к которому он принадлежит.
2.
Если число классов и их сущность определяются в процессе
классификации, то результатом процедуры классификации будет раз-
биение всей совокупности объектов на определенное число однород-
ных групп (классов).
В первом случае классификация проводится при наличии обу-
чающих выборок и является задачей дискриминантного анализа. Во
втором случае имеет место решение задач кластеризации или группи-
ровки.
Дискриминантный анализ
С помощью дискриминантного анализа на основании некоторых
признаков объект может быть причислен к одной из нескольких за-
данных заранее групп.
Линейный дискриминантный анализ основывается на предпо-
ложении, что данные подчиняются многомерному нормальному за-
кону. В дискриминантном анализе рассматриваются две задачи
44
:
1) устанавливается правило, в соответствии с которым объект
относится к одному из известных классов. Обычно это линейная
функция от признаков – функция классификации (или дискрими-
нантная функция):
S = b
1
х
1
+b
2
х
2
+... + b
n
х
n
+а ,
где
x
1
, …,х
n
— значения признаков, соответствующих рассмат-
риваемым объектам; константы
b
1
,...,
b
n
и
a
— коэффициенты, кото-
рые должны быть оценены с помощью дискриминантного анализа.
Целью анализа является определение таких коэффициентов, чтобы по
44
Орлов А.И. Прикладная статистика.–М.: Издательство «Экзамен», 2004.
171
значениям дискриминантной функции можно было с максимальной
четкостью провести разделение объектов по группам.
2) по установленному правилу классифицируются новые объек-
ты. Объект относится к классу
Do'stlaringiz bilan baham: |