11.11.7. ORAÇLE DATA MĠNĠNG proqram paketi
ORAÇLE firmasının məhsulu olan ORAÇLE DATA MĠNĠNG (ODM)
«Oraçle Enterprise Edition» proqram kompleksinin opsiyası və ya modulu hesab
olunur. ODM, DATA MĠNĠNG texnologiyasına aid olan metodlarla verilənlərin
analizi ücün nəzərdə tutulub. ODM biliklərin üzə cıxarılması texnologiyasının
591
bütün mərhələlərini–məsələnin qoyuluĢu, verilənlərin hazırlanması, modellərin
qurulması, analiz, nətiçələrin testlənməsi, tətbiq–əhatə edir.
Modellər tədqiq edilən obyektlər, müĢahidələr və situasiyalar haqqında
verilənlərin xüsusi alqoritmlərin köməyilə analizi əsasında avtomatik qurulur.
ODM modullarının əsasını təsnifat, reqressiya, klasterləĢdirmə modellərinin
qurulması ücün müxtəlif alqoritmləri reallaĢdıran prosedurlar təĢkil edirlər.
Verilənlərin hazırlanması mərhələsində istənilən relasiya bazasına, mətn
faylına, SAS formatlı fayla müraçiət təmin edilir. Verilənlərin cevrilməsi və
təmizlənməsi ücün əlavə vasitələr təsvir formasını dəyiĢməyə, qiymətləri
normallaĢdırmağa, qeyri-müəyyən və ya catıĢmayan qiymətləri aĢkarlamağa imkan
verir. Hazırlanan verilənlər əsasında xüsusi prosedurlar vasitəsilə proqnozlaĢdırma,
yeni situasiyaların təsnifatı, analogiyaların üzə cıxarılmasıı həyata kecirilir. ODM
beĢ tip modelin qurulmasını təmin edir. ODM-in qrafik vasitələri alınan nətiçələrin
analizi, modellərin düzgünlüyünün yoxlanması, dəqiqliyin və dayanıqlığın
qiymətləndirilməsi ücün geniĢ imkanlar yaradır.
ODM sisteminin əsas xarakteristikalarına aĢağıdakılar aiddir:
-kliyent-server arxitekturası ilə iĢləmək;
-paralel hesablama texnikasından geniĢ istifadə edilmə;
-hesablama resurslarının artırılması Ģəraitində yüksək dərəçədə miqyaslanma;
-biliklərin üzə cıxarılması modullarının Oraçle VBĠS-lərinə daxil edilməsinin
mümkünlüyü;
-instrumental mühüt kimi DATA MĠNĠNG infrastrukturu təqdim olunur;
-tətbiqlərin hazırlanması ücün APĠ (Appliçation Proqram Ġnterfaçe)
interfeysinin təqdim edilməsi.
ODM aĢağıdakı alqoritmləri reallaĢdırır:
1)Təsnifat modelləri (Naive Bayes, Adaptive Bayes Mining);
2)Təsnifat və reqressiya modelləri (Support Veçtor Maçhine);
3)Əhəmiyyətli atributların axtarıĢı (Minimum Desçriptor Lengtn);
4)KlasterləĢdirmə (Enhançed K-means, O-çluster);
5)Assosiasiyaların axtarıĢı (Apriory Algoritm);
592
6)Əlamətlərin üzə cıxarılması (Non-Negative Matrix Façtorization).
ODM alqoritmlərinin xüsusiyyəti ondan ibarətdir ki, onların hamısı bilavasitə
relasiya verilənlər bazaları ilə iĢləyirlər və verilənlərin həmin bazalardan cıxarılıb,
xüsusi formatlarda saxlanmasını tələb etmirlər. Bu alqoritmlərdən baĢqa ODM
paketiinə verilənlərin hazırlanması, nətiçələrin qiymətləndirilməsi və modelllərin
yeni verilənlər massivinə tətbiqi ücün vasitələr daxildir. Bütün bu imkanlardan
həm «Java APĠ» və ya «PL/SQL APĠ»-nin köməyilə proqram səviyyəsində, həm
də analitiklər ücün nəzərdə tutulmuĢ «ODM Çlient» qrafik mühitin köməyilə
istifadə oluna bilər.
ODM alqoritmlərinin qısa xarakteristikaları:
Naive Bayes (NB) alqoritmi
:
-ABN alqoritminə nisbətən daha sürətlə iĢləyir;
-atributların sayı 200-dən az olan verilənlər massivləri ücün tətbiqi məsləhət
görülür;
-alqoritmin dəqiqliyi ABN-ə nisbətən azdır.
Adaptive Bayes Network (ABN) alqoritmi:
-daha böyük sayda atributlar ücün yaxĢıdır;
-model (qaydaların generasiyası) əyanidir;
-NB-yə nisbətən daha dəqiq modellər qurulur;
-sazlanma ücün parametrlərin sayı coxdur.
Support Veçtor Maçhine alqoritmi.
Bu alqoritm vasitəsilə həm təsnifat, həm də reqressiya modelləri qurulur.
Reqressiya analoq kəmiyyətlərinin proqnozlaĢdırılması ücün tətbiq edilir. Onun
sadə halı xətti reqressiyadır.
Minimum Desçriptor Length alqoritmi.
Əsas vəzifəsi məqsəd dəyiĢənlərinin
proqnozlaĢdırılması ücün daha əhəmiyyətli atributların üzə cıxarılmasından
ibarətdir. Təsnifat modelinin qurulması prosesini sürətləndirmək məqsədilə istifadə
edilir.
Enhançed K-means alqoritmi.
KlasterləĢdirmə ücün istifadə edilən bu
alqoritmdə klasterlərin sayı əvvəlçədən istifadəci tərəfindən verilir.
593
KlasterləĢdirmə yalnız ədədi atributlara görə aparılır və onların sayı artıq
olmamılıdır. Yazıların sayına məhdudluq qoyulmur.
O-Çluster alqoritmi.
Bu alqoritm əvvəlkindən fərqli olaraq klasterlərin sayını
avtomatik təyin edir. o, həm ədədi, həm də kateqorial atributlarla iĢləyə bilər.
Böyük sayda atributlarla və böyük sayda yazılarla iĢləmə mümkündür.
Do'stlaringiz bilan baham: |