588
«StatSoft» kompaniyası tərəfindən yaradılan STATĠSTĠÇA DATA MĠNER
sistemi verilənlərin analizi ücün universal vasitədir. Burada müxtəlif verilənlər
bazaları ilə qarĢılıqlı əlaqə yaratmaqla həmin bazalardakı verilənlər analiz edilir və
nətiçədə qrafik yönümlü yanaĢma ilə hazır hesabatlar tərtib edilir.
STATĠSTĠÇA sistemi aĢağıdakıları təqdim edir:
-geniĢ spekrli hazır həllər;
-«MS Offiçe» paketi ilə tam inteqrallaĢdırılmıĢ rahat istifadəci interfeysi;
-verilənlərin analizi ücün güçlü vasitələr;
-böyük həçmli verilənlər massivləri ilə iĢləmək ücün tam optimallaĢdırılmıĢ
paket;
-cevik idarəetmə mexanizmi;
-səmərəli tətbiq;
-acıq ÇOM arxitekturası, istifadəcilərin tətbiqi proqramlarının dəstəklənməsi
(Visual Basiç sənaye standartı, Yava, Ç/Ç
++
).
Sistemin nüvəsini DATA MINING məsələlərinin həlli ücün 300-dən cox
prosedurdan, onlar arasındakı məntiqi əlaqələri təmin edən və verilənlər axınlarını
idarə edən vasitələrdən ibarət olan DATA MINING prosedurlarının bələdcisi
(browser) təĢkil edir.
STATĠSTĠÇA sisteminin iĢci sahəsi dörd əsas hissədən ibarətdir.
-
Data Açquisition
– verilənlərin yığılması. Bu hissədə istifadəci analiz ücün
verilənlər mənbələrini (verilənlər faylı, VB-yə sorğu və s.) təyin edir;
-
Data Preparation, Çleaning, Transformation
– verilənlərin hazırlanması,
cevrilməsi və təmizlənməsi. Burada verilənlər cevrilir, süzgəçlənir, qruplaĢdırılır
və s.
-
Data Analysis, Modeling, Çlassifiçation, Foreçasting
– verilənlərin analizi,
modelləĢdirmə, təsnifat, proqnozlaĢdırma. Burada istifadəci bələdcinin və ya hazır
modellərin köməyilə verilənlərin analizinin lazımi növlərini, məsələn,
proqnozlaĢdırma, təsnifat, modelləĢdirmə və s. verə bilər;
589
-
Reports
– nətiçələr. Bu hissədə istifadəci analizin nətiçələrinə baxa bilər,
onların növünü verə bilər və nətiçələri sazlaya bilər (məsələn, iĢci kitab, hesabat,
elektron çədvəl və s.).
STATĠSTĠÇA sisteminin analiz vasitələrini beĢ qrupa ayırmaq olar:
1
.General Sliçer / Diçer and Drill-Down Explorer
–niĢanlama, ayırma və
əsaslı analiz. DəyiĢənləri ayırmaq, qruplaĢdırmaq, statistikanı hesablamaq, tədqiqat
ücün qrafiklər qurmaq və s. prosedurlar toplusu.
2.General Çlassifier
– təsnifat. Təsnifat məsələsinin həlli ücün prosedurlar
paketi. Buraya ümumiləĢdirilmiĢ xətti modellər, təsnifat ağaçları, reqressiya
ağaçları, klaster analizi və s. daxildir.
3.General Modeler /Multivariate Exrlorer
– ümumiləĢdirilmiĢ xətti,
qeyri-
xətti və reqressiya modelləri. Bu komponent xətti, qeyri-xətti və reqressiya
modellərindən və təsnifat ağaçlarının analizi elementlərindən ibarətdir.
4
.General Foreçaster – proqnozlaĢdırma
. Bu komponent mövsümi modelləri,
eksponensial hamarlama,
Furye spektral analiz, mövsümi dekompozisiya
modellərini, neyron Ģəbəkələrin köməyilə proqnozlaĢdırmanı və s. özündə
birləĢdirir.
5.
General Neural Networks Explorer
–neyroĢəbəkə analizi. Bu qrupda
neyroĢəbəkə analizi prosedurlarının tam dəsti toplanıb.
Yuxarıda göstərilən komponentlər «StatSoft» firmasının məhsullarının
kombinasiyasından təĢkil olunmuĢlar. Bundan əlavə, STATĠSTĠÇA DATA
MĠNER sistemi DATA MINING instrumentlərini tamamlayan xüsusi prosedurları
da özündə birləĢdirir. Bu prosedurlara aĢağıdakılar aiddir:
-
Feature Seleçtion and Variable Filtering
(for very large data sets) –
verilənlərin xüsusi secimi və süzgəçlənməsi (cox böyük həçmli verilənlər massivi
ücün);
-
Assoçiative Rules
– assosiasiya qaydaları. Bu modul assosiasiya
qaydalarının üzə cıxarılması ücün «Apriory» alqoritmindən istifadə edir;
-
Ġnteraçtive Drill - Dovn Explorer
–interaktiv dərin analiz. Böyük həçmli
verilənlər massivni analiz edir;
590
-
Generalized EM
K-Means Çluster Analysis
– orta qiymətin maksimuüm və
K- orta metodu ilə klasterləĢdirmənin ümumi metodu;
-
Generalized Additive Models (GAM)
- ümumiləĢdirilmiĢ additiv modellər;
-
General Çlassifiçation and Regression Trees (GTress)
– ümumiləĢdirilmiĢ
təsnifat və reqressiya ağaçları;
-
General ÇHAĠD (Çhiç-square Automatiç Ġnteraçtion Deteçtion Models)
–
ümumiləĢdirilmiĢ ÇHAĠD (qarĢılıqlı təsiri avtomatik üzə cıxaran Hi-kvadrat);
-
Ġnteraçtive Çlassifiçation and Regression Trees
– interaktiv təsnifat və
reqressiya ağaçları;
-
Boosted Trees
– geniĢləndirilən sadə ağaçlar;
-
Multivariate Adaptive Regression Splines (Mar Splines)
– coxölcülü adaptiv
reqression splaynlar. Bu modul həm diskret, həm də analoq dəyiĢənlərinin, onların
tipindən və aralarındakı asılılıqların xarakterindən asılı olmayaraq emalı ücün
nəzərdə tutulub.
Göründüyü kimi, STATĠSTĠÇA sistemi geniĢ ceĢiddə müxtəlif analitik
prosedurlar təqdim edir. Odur ki, verilənlərin analizi metodlarını bilməyən
istifadəcilər ücün bu sistemin xidmətindən faydalanmaq cətindir. Bu səbəbdən də
«StatSoft» kompaniyası verilənlərin analizi və riyazi statistika sahəsində çüzi
təçrübəyə və biliyə malik olan adi istifadəcilər ücün iĢ rejimi nəzərə alıb. Bunun
ücün analizin ümumi metodlarından əlavə, praktikada daha cox rast gələn
məsələlərin (proqnozlaĢdırma, təsnifat, assosiasiya qaydalarının qurulması və s.)
həlli ücün verilənlərin analizinin son hazır modulları yaradılmıĢdır. Bu modullarla
iĢləmək ücün STATĠSTĠÇA sistemi istifadəciyə rahat və əlveriĢli interfeys təqdim
edir.
Do'stlaringiz bilan baham: