Data Mining ma’lumotlari. Data Mining usulini qo‘llashda asosiy talab – bu ma’lumotlar hajmining kattaligi bilan belgilanadi. Ushbu ma’lumotlar bazasi, umuman olganda, xatosiz shakllangan bo‘lishi kerak va korxona faoliyatini to‘liq qamrab olgan bo‘lishi va uning faoliyatini istalgan vaqtidagi holatini tiklash mumkin bo‘lishi kerak. Ma’lumotlar bazasi tarkibini loyihalashda unda bajariladigan so‘rovlar samarali bo‘lishi kerak. Bundan tashqari Data Mining bevosita OLAP usullari orqali shakllangan statistik ma’lumotlarda ham mavjud qonuniyatlarni qidirish imkoniga ega.
Data Mining usullari orqali aniqlaniladigan qonuniyatlar. Asosan Data Mining usullari quyidagi standart 5 ta qonuniyatlarni aniqlashga qaratilgan:
Assotsiatsiya – hodisalarning o‘zaro bog‘langanligi, masalan, tovar boshqa qandaydir tovar bilan birgalikda xarid qilinadi;
Ketma-ketlik – hodisalarning qandaydiy vaqt mobaynida o‘zaro bog‘langanligi, masalan, qandaydiy vaqt mobaynida xarid qilingan tovar bilan boshqa qandaydir tovar xarid qilinadi;
Tasniflash – hodisalar yoki obyektlardan tashkil topgan guruhni tavsiflovchi qandaydir alomatlar;
Klasterlash – tasniflashga o‘xshash bo‘lib, faqatgina bunda guruhlar oldindan ma’lum bo‘lmaydi, aksincha ular ma’lumotlarni qayta ishlash jarayonida aniqlanadi;
Davriy qonuniyatlar – ma’lumotlarning davriy o‘zgarishlarini aniqlaydi, masalan, tovarlarga sezonli talablarni mavjudligi.
Data Mining usullari. Data Mining usullari xilma-xil bo‘lib, hozirgi kunda quyidagi usullar e’tirof etilgan:
regression, dispersion va korrelyasion tahlil (ushbu usullar statistik dasturiy paketlarda mavjud, masalan SAS Institute, StatSoft kabi kompaniyalar mahsulotlarida);
empirik modellarga asoslangan aniq predmet sohasida mavjud tahlil usullari (bunda, ko‘pincha uncha qimmat bo‘lmagan moliyaviy tahlil vositalari qo‘llaniladi);
neyrotarmoqli algoritmlar, bevosita sun’iy neyron tarmog‘i bo‘lib, Bir-biri bilan o‘zaro ta’sirda bo‘lgan nerv hujayralari yoki ularning harakatlarini modellashtirayotgan tarkibiy qismlardan tashkil topgan tarmoq. Neyron tarmoqlari sun’iy intellektda inson miyasi faoliyatini modellashtirish uchun o‘rganiladi. Ushbu tarmoq miya kabi ko‘pgina kiruvchi signallaridan parallel tarzda ta’sirlanuvchi bir-biriga bog‘langan neyronlardan tashkil topgan. Odatda neyron tarmog‘i avvalo ko‘p hajmdagi ma’lumotlar yoki ma’lumotlarning o‘zaro bog‘liqligi qoidalarini o‘rganadi (masalan, «Bobomning yoshi otamnikidan katta»). Neyron tarmog‘i avvalgi boy tajriba bazasiga ega bo‘lganda asosan samaralidir. Neyron tarmoqlari sohasiga 1950-yillarda Stenford Universiteti vakili Bernard Vidrou asos solgan. Neyron tarmoqlari ovozni tanish, tasvirlarni aniqlash tizimlari, sanoat robotlari, aeronavtika, ma’lumotlarni olish va boshqa sohalarda qo‘llaniladi;
algoritmlar, tarixiy ma’lumotlarga yaqin bo‘lgan ma’lumotlarni aniqlash. Ushbu usul “eng yaqin qo‘shni” deb ham ataladi;
yechim daraxti – bu shajaraviy tuzilma bo‘lib, savollar va ularga berilgan “Ha” va “Yo‘q” javoblar to‘plamidan iborat bo‘ladi. Ushbu usul ma’lumotlarda mavjud qonuniyatlarni aniqlashda qulay bo‘lmasada, undan asosan prognoz masalalarida qo‘llaniladi, chunki undan olinadigan javob aniq ko‘rinishga ega;
klasterli modellar, bunda ma’lumotlar to‘plamidan bir necha maydonlar asosida o‘xshash hodisalarning bitta guruhga birlashtirish tushuniladi, prognoz tizimlarida keng qo‘llaniladi;
variantlarni saralashni cheklangan algoritmlari, bunda ma’lumotlarning kichik to‘plamlarida oddiy hodisalar chastotasi hisoblanadi;
rivojlanuvchi dasturlash, bunda ishlab chiqilgan boshlang‘ich algoritm asosida ma’lumotlarda mavjud bog‘lanishlarni qidiruv jarayonida bevosita algoritmda o‘zgarishlar amalga oshiriladi;
Do'stlaringiz bilan baham: |