Редактор: досент Н


Verilənlərin hazırlanması



Download 6,21 Mb.
Pdf ko'rish
bet335/378
Sana09.10.2022
Hajmi6,21 Mb.
#852056
1   ...   331   332   333   334   335   336   337   338   ...   378
Bog'liq
informasiya sistemleri s q kerimov aze

Verilənlərin hazırlanması 
mərhələsində aĢağıdakı iĢlər görülür: 
-verilənlərə qoyulan tələblərin formalaĢdırılması və analizi; 
-verilənlərin toplanması; 
-verilənlərin ilkin emalı və ya təmizlənməsi. 
1.
Verilənlərə qoyulan tələblərin formalaĢdırılması və analizi.
Bu məqsədlə
 
istifadəcilərin çoğrafi, təĢkilatı və ya funksional baxımdan ayrılması məsələsi, 
analiz ücün verilənlərə müraçiət məsələsi, verilənlərin xariçi və daxili 
mənbələrinin tələb olunması və sistemin analitik xarakteristikaları (verilənlərin 
ölcüləri, cıxıĢ sənədlərinin əsas növləri, informasiyanın cevrilməsi ardıçıllığı və s.) 
öyrənilir və bütün bunların əsasında DATA MĠNĠNG-in həyata kecirilməsi ücün 
lazım olan verilənlər modelləĢdirilir. 
2.
Verilənlərin toplanması. 
DATA MĠNĠNG ücün verilənlər mövçud 
informasiya sistemlərindən, yəni operativ, arayıĢ və arxiv verilənlər bazalarından 
götürülür. 
DATA 
MĠNĠNG ücün informasiya həmcinin informasiya 
sistemlərindən, xariçi mənbələrdən, kağız daĢıyıçılardan və həmcinin ekspertlərdən 
və ya sorğu vasitəsilə alına bilər. 
Verilənlərin hazırlanması prosesində analitiklər və iĢ içracıları mövçud olan 
göstəriçilərlə kifayətlənməməli və analiz edilən prosesə təsir edən faktların və 
əlamətlərin maksimum miqdarını nəzərə almalıdırlar. 
Bu mərhələdə bəzi verilənlərin kodlaĢdırılması aparılır. Bu əsasən qeyri-səlis 
verilənlərə aiddir. Məsələn, «müĢtərinin gəlir səviyyəsi» atributunun 
qiymətləri«cox aĢağı», «aĢağı», «orta», «yüksək», «cox yüksək» ola bilər. Analitik 
ekspertlə birlikdə bu çür qeyri-səlis qiymətləri səlis qiymətlərlə ifadə etməlidir. 
Bunun ücün qeyri-səlis coxluqlar nəzəriyyəsinin müddəalarından istifadə edilir. 
Verilənlərin tələb olunan miqdarının təyin edilməsində verilənlərin nizamlı 
olub-olmamasını nəzərə almaq lazımdır. Əgər verilənlər nizamlıdırsa və vaxt sırası 
üzrə yığılıbsa, onda verilənlər yığımının mövsüm/dövri komponentə uyğun olub-


552 
olmamasını bilmək lazımdır. Verilənlər
yığımında mövsüm/dövri komponent 
varsa, onda ən azı bir mövsüm/dövr ücün verilənlər olmalıdır. 
Verilənlər nizamlı olmadıqda, yəni verilənlər yığımı vaxtla bağlı olmadıqda, 
aĢağıdakı qaydaları nəzərə almaq lazımdır: 
-verilənlər yığımında yazıların sayı ktfayət qədər olmalıdır, cünki verilənlərin 
sayı az olduqda model düzgün alınmaya bilər; 
-köhnəlmiĢ və qeyri-tipik verilənləri modeldən cıxarmaq lazımdır; 
-yığımdakı yazıların miqdarı ilə giriĢ verilənlərinin (dəyiĢənlərin) miqdarı 
arasındakı nisbəti nəzərə almaq lazımdır. Yazıların (müĢahidələrin) sayı 
dəyiĢənlərin sayından xeyli cox olmalıdır; 
-verilənlər yığımı mümkün qədər cox situasiyanı təmsil etməlidir, müxtəlif 
misalların təsviri real situasiyaya uyğun olmalıdır. 
3.
Verilənlərin ilkin emalı. 
Analiz edilən verilənlər keyfiyyətli olmalıdır. 
Verilənlərin keyfiyyəti onların tamlığı, dəqiqliyi, vaxtında əldə edilməsi və 
interpretasiya olunma imkanı ilə təyin edilir. Bu çür verilənlər qərar qəbul etmək 
ücün keyfiyyətli biliklərin alınmasına zəmanət verirlər. DATA MĠNĠNG-də 
verilənlərin keyfiyyəti onların cıxarılması, cevrilməsi və yüklənməsi (Extraçtion, 
Transformation, Loading-ETL) və həmcinin analiz ücün verilənləri hazırlayan 
mənbələrdən alınması prosesləri ilə təmin edilir. 
Keyfiyyətli verilənlərlə yanaĢı DATA MĠNĠNG prosesində bəzən keyfiyyətsiz 
və ya 
cirkli verilənlərə 
də rast gəlinir. Cirkli verilənlərin ən cox yayılmıĢ növləri 
bunlardır: 
-buraxılan qiymətlər; 
-təkrarlanan verilənlər; 
-küylər və tullantılar. 
Qiymətlər aĢağıdakı səbəblərdən buraxıla bilər: 
-verilənlərin yığılmaması (məsələn, anketləĢdirmə zamanı fərd yaĢını 
göstərməyib); 
-müəyyən atributlar müəyyən obyektlər ücün tətbiq edilə bilməyəndə 
(məsələn, «illik gəlir» uĢaq ücün tətbiq edilə bilməz). 


553 
Situasiyadan asılı olaraq buraxılan verilənlərlə aĢağıdakı kimi davranmaq 
tövsiyyə edilir: 1)buraxılan qiymətlərə malik olan obyektləri emal etməmək; 
2)buraxılan verilənlərin yeni qiymətlərini hesablamaq; 3)analiz prosesində 
buraxılan qiymətləri nəzərə almamaq; 4)buraxılan qiymətləri mümkün qiymətlərlə 
əvəz etmək. 
Təkrarlanan verilənlər
və ya dublikatlar bütün atributları eyni qiymətə malik 
olan yazılara deyilir. Dublikatların emalında iki variant mümkündür. 1-çi variantda 
təkrarlanan yazılara inamsızlıq yarandıqda istifadə edilir. 2-çi variantda dublikat 
yazılar bir unikal yazı ilə əvəz edilir. 
Küylər və tullantılar
– verilənlər yığımında ən cox fərqlənən obyektlər və ya 
müĢahidələrdir. Tullantılar ayrı-ayrı müĢahidələri əks etdirə bilərlər və ya müəyyən 
qrup təĢkil edə bilərlər. Analitikin vəzifəsi təkçə onları müəyyənləĢdirmək deyil, 
həm də onların sonrakı analizin nətiçələrinə təsirini qiymətləndirməkdir. 
Küylərlə və tullantılarla iĢləyərkən ikimərhələli analizdən geniĢ istifadə 
olunur – onları nəzərə almaqla və almamaqla. Sonra isə alınan nətiçələr müqayisə 
edilir. 
DATA MĠNĠNG-in müxtəlif metodlarının tullantılara həssaslığı müxtəlif 
olur. Odur ki, bu faktı verilənlərin analiz metodunu secərkən nəzərə almaq 
lazımdır. DATA MINING-in bəzi instrumentləri verilənlərin küylərdən və 
tullantılardan təmizlənməsi ücün daxili proseduralara malikdirlər. 
Verilənlərin vizullaĢdırılması tullantıları qrafiki Ģəkildə təsvir etməyə imkan 
yaradır. 
Cirkli verilənlər əsasında DATA MINING-in nətiçələri etibarlı və faydalı
sayıla bilməz. Lakin bu çür verilənlərin varlığı onların mütləq təmizlənməsinin və 
ya nəzərə alınmamasının vaçibliyi demək deyildir. Cünki verilənlərin təmizlənməsi 
kifayət qədər əlavə xərç və vaxt tələb edir. Odur ki, cirkli verilənlərin saxlanması 
ilə onların təmizlənməsinə sərf olunan xərç və ya vaxt arasında münasib secim 
aparmaq lazımdır. 

Download 6,21 Mb.

Do'stlaringiz bilan baham:
1   ...   331   332   333   334   335   336   337   338   ...   378




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish