11.5.DATA MĠNĠNG metodlarının təsnifatı
541
Ġlkin verilənlərlə iĢləmə prinsipinə görə DATA MĠNĠNG metodlarını iki
qrupa bölürlər: 1) verilənləri saxlamaqla onlardan bilavasitə istifadə edən metodlar;
2) verilənlərin (Ģablonların) distillə edilməsi ilə formal qanunauyğunluqların
aĢkarlanması və istifadə edilməsi metodları.
1-çi qrup metodlarda
ilkin verilənlər detallaĢdıırılmıĢ Ģəkildə saxlanır və
bilavasitə proqnostik modelləĢdirmə və /və ya istisnaların analizi mərhələlərində
istifadə edilir. Bu qrup metodların tətbiqi zamanı cox böyük verilənlər bazalarının
analizində cətinliklər yarana bilər. Bu qrup metodlara klaster analizi, analogiyaya
görə mühakimə metodu aiddir.
ġablonların distillə edilməsi adlanan 2-çi qrup metodlarda
ilkin verilənlərdən
bir informasiya nümunəsi (Ģablon) cıxarılır və növü tətbiq edilən metoddan asılı
olan formal konstruksiyalara cevrilir. Bu proses sərbəst axtarıĢ mərhələsində yerinə
yetirilir. 1-çi qrup metodlarda isə bu mərhələ prinsip etibarilə olmur. Proqnostik
modelləĢdirmə və istisnaların analizi mərhə-lələrində sərbəst axtarıĢ mərhələsinin
nətiçələrindən istifadə edilir. Bu nətiçələr verilənlər bazalarının özləri ilə
müqayisədə daha yığçam olurlar. Bu qrupa məntiqi metodlar, vizuallaĢdırma
metodları, kross-tabulyasiya metodları, tənliklərə əsaslanan metodlar aiddir.
Məntiqi metodlara
qeyri-səlis sorğular və analizlər, simvol qaydaları, həlletmə
ağaçları, genetik alqoritmlər daxildir. Onların köməyilə tapılan qanunauyğunluqlar
istifdəci ücün kifayət qədər Ģəffaf Ģəkildə tərtib edilir. Alınan qaydalarda kəsilməz
və diskret dəyiĢənlər ola bilər. Həlletmə ağaçı asanlıqla simvol qaydaları dəstinə
cevrilə bilər. Bunun ücün ağaçın kökündən terminal təpəyə qədər yol bir qayda
kimi generasiya olunur. Həlletmə ağaçları və qaydalar faktiki olaraq eyni
məsələnin müxtəlif üsullarla həllidir və bir-birindən yalnız imkanlarına görə
fərqlənir. Bundan əlavə, qaydalar həlletmə ağaçlarına nisbətən aĢağı sürətli
alqoritmlərlə reallaĢdırılır.
Kross-tabulasiya metodlarına
agentlər, bayes Ģəbəkələri və kross-çədvəl
vizuallaĢdırma metodları aiddir. Sonunçu metod qanunauyğunluqların sərbəst
axtarıĢını təmin edir.
542
Tənliklərə əsaslanan metodlar
aĢkarlanan qanunauyğunluqları riyazi tənliklər
Ģəklində ifadə edirlər. Odur ki, onlar yalnız ədədi dəyiĢənlərlə iĢləyə bilirlər, digər
tipli dəyiĢənlər kod formasına cevrilməlidir. Bu səbəbdən bu metodların tətbiqi
məhdudlaĢır, buna baxmayaraq onlardan müxtəlif məsələlərin, ələlxüsus
proqnozlaĢdırma məsələlərinin həlli ücün geniĢ istifadə edilir. Bu qrupa əsasən
statistik metodlar və neyron Ģəbəkələri daxildir.
Statistik metodlar
ən cox proqnozlaĢdırma məsələlərinin həllində tətbiq edilir.
Verilənlərin statistik analizi ücün coxlu metodlar mövçuddur, məsələn,
korrelyasiya-reqressiya analizi, dinamik sıraların korrelyasiyası, dinamik sıralarda
meyletmənin aĢkarlanması, harmonik analiz və s.
Digər təsnifata görə DATA MĠNĠNG metodlarını iki sinfə bölürlər: statistik
və kibernetik metodlar. Bu təsnifat sxemi riyazi modellərin öyrədilməsinə müxtəlif
yanaĢmalara əsaslanır
81
. Burada
statistik metodlar
retrospektiv verilənlərdə əks
olunan təçrübə nətiçələrinin orta qiymətlərindən istifadə edilməsinə əsaslanırlar.
Bu baxımdan statistik metodları 4 qrupa bölürlər: 1) deskriptiv analiz və ilkin
verilənlərin təsviri, 2) əlaqələrin analizi (korrelyasiya və reqressiya analizi, faktor
analizi, dispersiya analizi), 3) coxölcülü statistik analiz (komponent analizi,
diskriminant analizi, coxölcülü reqressiya analizi, kononik korrelyasiya və s.), 4)
vaxt sıralarının analizi (dinamik modellər və proqnozlaĢdırma).
Kibernetik metodlar
kompüter riyaziyyatına və süni intellektə əsaslanan
yanaĢmalar toplusudur. Bu sinfə aĢağıdakı metodları aid edirlər: neyron Ģəbəkələri
(tanınma, klasterləĢdirmə, proqnozlaĢdırma), təkamül proqramlaĢdırma, genetik
alqoritmlər (optimallaĢdırma), assosiativ axtarıĢ (analoqların və prototiplərin
axtarıĢı), qeyri-səlis məntiq, həlletmə ağaçları, ekspert biliklərin emalı metodları və
s.
Metodları həmcinin DATA MĠNĠNG-in həll etdiyi məsələlərə görə də
təsnifata ayrılılar. Burada iki təsnifat sxemi mövçuddur. 1-çi təsnifat sxeminə görə
metodları iki qrupa ayırırlar: 1)
seqmentləĢdirmə
(təsnifat və klasterləĢdirmə), 2)
proqnozlaĢdırma
məsələlərinin həlli ücün metodlar. 2-çi təsnifat sxeminə uyğun
543
olaraq metodlar iki istiqamətdə yönəldilir: 1) təsviri nətiçələrin alınması ücün, 2)
proqnozlaĢdırıçı nətiçələrin alınması ücün.
Təsviri metodlar
verilənləri təsvir edən
Ģablonların (nümunələrin) tapılması ücün tətbiq edilir. Bu qrupa klaster analizinin
iterativ metodları, o çümlədən, k-orta və k-mediana alqoritmləri, klaster analizinin
iyerarxik metodları, Koxonenin özünütəĢkil kartları, kross-çədvəl vizuallaĢdırma
metodları, vizuallaĢdırmanın digər metodları və s. aiddir.
ProqnozlaĢdırma
metodları müəyyən dəyiĢənlərin məlum qiymətlərindən istifadə etməklə digər
naməlum dəyiĢənlərin qiymətlərinin proqnozlaĢdırılması ücün tətbiq edilir. Bu
metodlara neyron Ģəbəkələr, həlletmə ağaçları, xətti reqressiya, yaxın qonĢu
metodu, dayaq vektorları metodu və s. aiddir.
Do'stlaringiz bilan baham: |