Supervised learning. Mashinali ta’lim texnologiyasiga asoslangan bo‘lib, ma’lumotlar massivida funksional bog‘lanishlarni aniqlashga imkon beradi.
Simulation. Murakkab tizimlarni harakatini modellashtirish orqali bashoratlash, har xil holatlarni kuzatish bilan jarayonni rejalashtirish imkonini beradi.
Time series analysis. Vaqt bilan bog‘liq bo‘lgan takroriy va doimiy ma’lumotlarni tahlil qilish usullarini o‘z ichiga olgan to‘plam bo‘lib, iqtisodiyotda, masalan, qimmatbaho qog‘ozlar bozorini kuzatishda va tahlil qilishda qo‘llaniladi.
Unsupervised learning. Mashinali ta’lim texnologiyasiga asoslangan bo‘lib, tahlil qilinadigan ma’lumotlar massividan noma’lum bo‘lgan funksional bog‘lanishlarni aniqlashga imkon beradi.
Visualisation. Katta massiv ma’lumotlarini qayta ishlash natijalarini tahlil qilish uchun natijalarni diagrammalar yoki animatsiyali tasvirlar ko‘rinishida chiqarishda qo‘llaniladi.
Data Mining haqida. Hozirgi kunda “blockchain”, “bitcoin”, “big data”, “virtual corporation”, “peering net” kabi tushunchalar ichidan “big data” (katta, yirik ma’lumotlar) paydo bo‘lgan sanasi aniq hisoblanadi, bu 2008-yil 3-sentabr, chunki ilmiy Nature jurnalida shu haqida maqola chop etilgan edi .
Har qanday zamonaviy kompaniya o‘z faoliyati davomida ma’lumotlar bazasini yaratadi va uni to‘ldirib boradi, masalan, mahsulotlar, mijozlar, sotuvlar. Ma’lumotlar bazasiga kiritilgan yozuvlar aniq fakt yoki obyekt haqida bo‘lishi mumkin. Masalan, tovarlarni sotilishi haqidagi ma’lumotlar, bunda tovar nomi, kimga sotilganligi, uning narxi kabi ma’lumotlar kiritiladi. Umuman olganda bunday ma’lumotlar odatiy bo‘lib, kunlik faoliyatda qarorlar qabul qilishda foydalaniladi. Ammo, yillar davomida to‘plangan ma’lumotlar hajmi oshishi bilan qo‘shimcha va qimmatbaho axborotlarga ega bo‘lish mumkin ekan, masalan, ma’lumotlar orasida qandaydir qonuniyatlar aniqlanishi mumkin. Ko‘picha quyidagi axborotlarga ega bo‘linadi: qaysi tovar davriylik qonuniyatga mos keladi, tovar bilan mijozlarni bog‘lovchi omillar, qaysi tovar xarid qilinganda, u bilan birga boshqa tovar xarid qilinadi va b.
Bunday ko‘rinishdagi ma’lumotlar asosan kompaniyaning strategik rejalarini ishlab chiqish, bo‘lg‘usi holatni oldindan bilish, xavflarni tahlil
qilish imkonini beradi va bular qimmatbaho axborotlar hisoblanadi. Shu bois, ushbu jarayon Data Mining (“mining” so‘zi ingliz tilidan “foydali qazilmalarni olish” ) deb nomlanadi. Data Mining bevosita qanqaydir texnologiyani anglatmaydi, aksincha matematika va statistikada mavjud usullaridan foydalanib, qandaydir qonuniyatlar va bog‘lanishlarni aniqlaydi. Bunda matematik statistika yoki “online analytical processing” ( OLAP) usullari yordamida ma’lumotlarni tahlil qilish yetarli bo‘lmay qoldi. Chunki ushbu usullar oldindan taklif etilgan gipotezani tasdiqlashga qaratilgan. Ammo gipoteza aniq bo‘lmagan variantlarda ushbu usullarni qo‘llab bo‘lmaydi.
Zamonaviy Data Mining asosida shablon tushunchasi olingan bo‘lib, unda ma’lumotlar bazasining bir qismiga mansub bo‘lgan qandaydir qonuniyat yotadi. Shablonlarni qidirishda qo‘llaniladigan usullarda qism to‘plamga nisbatan hech qanday taxmin qabul qilinmaydi. Tushunarli bo‘lish uchun quyidagi masala qo‘yilishini taqqoslash o‘rinli:
Statistik tahlil va OLAP usullarini qo‘llashda quyidagi masalani yechish talab etiladi, masalan:”Sotilgan tovarlarning o‘rtacha qiymati nimaga teng?”.
Data Mining usullarini qo‘llashda esa quyidagi masalani yechish talab etiladi, masalan:”Sotilgan tovarlarning birlashtiruvchi alomatlar mavjud-mi?” .
Marketing nuqtayi nazar, ayniqsa, ikkinchi savolga berilgan javob korxona faoliyatini rejalashtirishga imkon beradi.
Demak, Data Mining yondashuvining asosiy jihati – bu uning nostandart shablonlarni mustaqil aniqlashdan va ularga mansub gipotezani taqdim etishdan iborat. Shu bilan birga, Data Mining yondashuvida statistika va OLAP usullaridan foydalanishni rad etilmaydi, chunki ushbu usullar orqali qidirilayotgan qonuniyatlarni tushunishga yordam beradi.
Do'stlaringiz bilan baham: |