III-Bo’lim. Modulni o’qitishda foydalaniladigan interfaol talim metodlari
IV-Bo’lim. Nazariy materiallar
Kirish. Asosiy tushunchalar va ta'riflar.
Ma'ruza 1. Kirish. Asosiy tushunchalar va ta'riflar.
REJA
Ma'lumotlarni qayta ishlashga kirish
OLAP tizimlari.
OLAP tizimi arxitekturasi
Tayanch tushunchalar: Ma’lumotlarni qayta ishlash, ma’lumotlar ombori, ma’lumotlarni tahlil qilish, ma’lumotlar bo’limi, konsolidatsiya , chuqurlashtirish, OLAP tizimlari, OLAP serveri, OLAP mijozi, MOLAP, ROLAP, HOLAP, DOLAP.
1. Ma'lumotlarni qayta ishlashga kirish
2002 yilda Kaliforniya Berkli universiteti professorlarining hisob-kitoblariga ko'ra, dunyodagi ma'lumotlar miqdori besh milliard (5 000 000 000 000 000 000) baytga oshgan. Boshqa hisob-kitoblarga ko'ra, har 2-3 yilda ma'lumot ikki barobar ortadi. Ushbu ma`lumotlar oqimi ma'lumotlarning biznes, Internet va boshqa manbalardan keladi. 2003 yilda eng yirik ma'lumotlar bazalari orasida France Telecom 30,000 milliard baytlik DSS tizimiga va 500,000 milliard baytlik Alexa Internet arxiviga ega edi. 1989 yilda tashkil etilgan ma'lumotlarda bilimlarni kashf qilish bo'yicha birinchi seminarda bir megabayt ( 1000 000) katta ma'lumotlar bazasi hajmi deb hisoblangan. Oxirgi KDD 2003 konferentsiyasida bir ma'ruzachi astronomiya uchun ko'p terabaytli ma'lumotlar bazasini muhokama qildi va petabaytlar bilan shug'ullanish zarurligini bashorat qildi (1 terabayt = 1000 milliard bayt va 1 petabayt = 1000 terabayt). Axborotning juda ko'pligi tufayli uning juda oz qismini inson ko'zi ko'ra olmaydi.
Ushbu ma'lumot okeanida foydali narsani tushunish va topishga bo'lgan yagona umidimiz - bu Data Mining usullaridan keng foydalanish. Ma'lumotni qazib olish texnologiyasi (ma'lumotlarda ma'lumotni kashf qilish deb ham ataladi) ma'lumotlar bazalarida yangi, haqiqiy va potentsial foydali bilimlarni topish jarayonini o'rganadi. Data Mining bir nechta fanlar chorrahasida joylashgan bo'lib, ularning asosiylari ma'lumotlar bazasi tizimlari, statistika va sun'iy intellektdir. Data Mining sohasi 1989-yildagi bir seminardan 2003-yilda dunyoning koʻplab mamlakatlarida minglab tadqiqotchilar ishtirokidagi oʻnlab xalqaro konferentsiyalargacha oʻsdi. Ma'lumotlarni ishlab chiqish ma'lumotlarning katta hajmiga ega bo'lgan ko'plab sohalarda keng qo'llaniladi : fanda - astronomiya, biologiya, bioinformatika, tibbiyot, fizika va boshqa sohalarda; biznesda - savdo, telekommunikatsiya, bank, sanoat ishlab chiqarish va boshqalar.
Internet tufayli Data Mining har kuni soniyada minglab marta ishlatiladi - har safar kimdir Internetdagi Google yoki boshqa qidiruv tizimlaridan foydalanganda. Tadqiqotchilar ishlayotgan maʼlumotlar turlari nafaqat raqamli maʼlumotlarni, balki tobora ortib borayotgan matn, tasvir, video, ovoz va boshqalarni ham oʻz ichiga oladi. Data Miningning yangi va tez rivojlanayotgan qismidan biri havola tahlilidir.U bioinformatika, raqamli kabi turli sohalarda qoʻllanilishi mumkin. kutubxonalar va terrorizmdan himoya. Ma'lumotlar konchiligi uchun matematik va statistik yondashuvlar asos bo'lib xizmat qiladi. Moskvalik va 1970-yillarda mashhur bo‘lgan Ikkinchi matematika maktabining talabasi sifatida men ushbu muhim va qiziqarli sohani qamrab olgan birinchi kitobga rus tilida so‘zboshi yozishdan ayniqsa mamnunman.
Do'stlaringiz bilan baham: |