Data warehouse tizimi quyidagi nom bilan ham tanilgan:
Decision Support System (DSS) (Qarorlarni qo'llab-quvvatlash tizimi (DSS)
Executive Information System (Ijroiya axborot tizimi)
Management Information System (Boshqaruv axborot tizimi)
Business Intelligence Solution (Business Intelligence Qarori)
Analytic Application (Analitik dastur)
Data Warehouse (Ma'lumotlar ombori)
Datawarehouse tarixi
Ma'lumotlar ombori foydalanuvchilarga o'z tashkilotlari faoliyatini tushunish va yaxshilash uchun foyda keltiradi. Ma'lumotlarni saqlash zarurati kompyuter tizimlari murakkablashib borishi va ortib boruvchi Axborot hajmini boshqarish uchun zarur bo'lganligi sababli paydo bo'ldi. Biroq, ma'lumotni saqlash yangi narsa emas.
Data Warehouse rivojlanishidagi ba'zi muhim voqealar
1960 yil - Dartmut va General Mills qo'shma tadqiqot loyihasida o'lchovlar va faktlar atamalarini ishlab chiqdilar.
1970 yil - Nilsen va IRI chakana savdosi uchun o'lchovli ma'lumotlar marshrutlarini taqdim etdi.
1983 yil - Tera Data Corporation qarorlarni qo'llab-quvvatlash uchun maxsus ishlab chiqilgan ma'lumotlar bazasini boshqarish tizimini joriy qildi
Ma'lumotlarni saqlash 1980 yillarning oxirida IBM ishchisi Pol Merfi va Barri Devlin Business Data Warehouse-ni ishlab chiqqandan so'ng boshlandi.
Biroq, haqiqiy kontseptsiya Inmon Bill tomonidan berilgan. U ma'lumotlar omborining otasi sifatida qaraldi. U omborni qurish, ishlatish va unga xizmat ko'rsatish uchun turli xil mavzularda va korporativ ma'lumot fabrikasida yozgan.
Datawarehouse qanday ishlaydi?
Ma'lumotlar ombori ma'lumotlar bir yoki bir nechta ma'lumot manbalaridan kelib chiqadigan markaziy ombor sifatida ishlaydi. Ma'lumotlar tranzaksiya tizimidan va boshqa relyatsion ma'lumotlar bazalaridan ma'lumotlar omboriga oqadi.
Ma'lumotlar quyidagicha bo'lishi mumkin:
Tuzilgan
Yarim tuzilgan
Tuzilmagan ma'lumotlar
Ma'lumotlar qayta ishlanadi, o'zgartiriladi va qabul qilinadi, shunda foydalanuvchilar ma'lumotlar zahirasida qayta ishlangan ma'lumotlarga Business Intelligence vositalari, SQL mijozlari va elektron jadvallari orqali kirishlari mumkin. Ma'lumotlar ombori turli xil manbalardan keladigan ma'lumotlarni bitta keng ma'lumotlar bazasiga birlashtiradi.
Ushbu ma'lumotlarning barchasini bir joyga birlashtirib, tashkilot o'z mijozlarini yanada yaxlit tahlil qilishi mumkin. Bu mavjud bo'lgan barcha ma'lumotlarni ko'rib chiqqanligini ta'minlashga yordam beradi. Ma'lumotlarni saqlash ma'lumotlar qazib olish imkoniyatini yaratadi. Ma'lumotlarni qazib olish ma'lumotlarning yuqori savdosi va daromadiga olib kelishi mumkin bo'lgan naqshlarni qidirmoqda.
Data Warehousening turlari
Data Warehousening uchta asosiy turi:
1. Enterprise Data Warehouse (EDW):
Enterprise Data Warehouse (EDW) - bu markazlashtirilgan ombor. U korxona bo'ylab qarorlarni qo'llab-quvvatlash xizmatini taqdim etadi. Bu ma'lumotlarni tartibga solish va namoyish qilish uchun yagona yondashuvni taklif etadi. Shuningdek, u ma'lumotni mavzuga qarab tasniflash va ushbu bo'limlarga muvofiq kirish imkoniyatini beradi.
2. Operatsion ma'lumotlar do'koni:
Operatsion ma'lumotlar do'koni, shuningdek, ODS deb ham ataladi, ma'lumotlar ombori va OLTP tizimlari talab qilinadigan hisobot tashkilotlarini qo'llab-quvvatlamaganda, ma'lumotlar omboridan boshqa narsa emas. ODS-da ma'lumotlar ombori real vaqtda yangilanadi. Shunday qilib, Xodimlarning yozuvlarini saqlash kabi odatiy mashg'ulotlar uchun keng ma'qul.
3. Data Mart:
Data mart - bu ma'lumotlar omborining bir qismidir. Bu savdo, moliya, sotish yoki moliya kabi ma'lum bir biznes yo'nalishi uchun maxsus ishlab chiqilgan. Mustaqil ma'lumotlar martida ma'lumotlar to'g'ridan-to'g'ri manbalardan to'planishi mumkin.
Data Warehouse umumiy bosqichlari
Ilgari tashkilotlar ma'lumotlar omboridan nisbatan oddiy foydalanishni boshladilar. Biroq, vaqt o'tishi bilan ma'lumotlar omboridan yanada murakkab foydalanish boshlandi.
Quyida ma'lumotlar omboridan (DWH) foydalanishning umumiy bosqichlari keltirilgan:
Oflayn operatsion ma'lumotlar bazasi:
Ushbu bosqichda ma'lumotlar faqat operatsion tizimdan boshqa serverga ko'chiriladi. Shu tarzda, ko'chirilgan ma'lumotlarni yuklash, qayta ishlash va hisobot berish operatsion tizim ishiga ta'sir qilmaydi.
Oflayn Data Warehouse:
Ma'lumotlar omboridagi ma'lumotlar Operatsion ma'lumotlar bazasidan muntazam ravishda yangilanadi. Datawarehouse-dagi ma'lumotlar xaritada tuzilgan va Datawarehouse maqsadlariga muvofiq ravishda o'zgartirilgan.
Haqiqiy vaqtda Data Warehouse:
Ushbu bosqichda ma'lumotlar bazalari operatsion ma'lumotlar bazasida har qanday operatsiya sodir bo'lganda yangilanadi. Masalan, aviakompaniya yoki temir yo'llarni bron qilish tizimi.
Integratsiyalashgan Data Warehouse:
Ushbu bosqichda operatsion tizim operatsiyani amalga oshirganda ma'lumotlar omborlari doimiy ravishda yangilanadi. So'ngra ma'lumotlar ombori operatsion tizimga o'tkaziladigan operatsiyalarni ishlab chiqaradi.
Data Warehouse tarkibiy qismlari
Data Warehouse ning to'rtta tarkibiy qismi:
Yuk menejeri: Yuk menejeri oldingi komponent deb ham ataladi. U ma'lumotlarni qazib olish va omborga yuklash bilan bog'liq barcha operatsiyalarni bajaradi. Ushbu operatsiyalarga ma'lumotlar omboriga kirish uchun ma'lumotlarni tayyorlash uchun transformatsiyalar kiradi.
Warehouse menejeri: ombor menejeri ombordagi ma'lumotlarni boshqarish bilan bog'liq operatsiyalarni bajaradi. U izchillikni ta'minlash, indekslar va ko'rinishlarni yaratish, denormalizatsiya va agregatsiyalarni yaratish, manba ma'lumotlarini o'zgartirish va birlashtirish, arxivlash va pishirish ma'lumotlarini tahlil qilish kabi operatsiyalarni bajaradi.
So'rovlar menejeri: So'rovlar menejeri backend komponenti sifatida ham tanilgan. U foydalanuvchi so'rovlarini boshqarish bilan bog'liq barcha operatsion operatsiyalarni bajaradi. Ushbu ma'lumotlar ombori tarkibiy qismlarining operatsiyalari so'rovlarni bajarilishini rejalashtirish uchun tegishli jadvallarga to'g'ridan-to'g'ri so'rovlardir.
Data Warehouse amalga oshirish bosqichlari
Data Warehouseni amalga oshirish bilan bog'liq bo'lgan biznes xavfini hal qilishning eng yaxshi usuli quyida keltirilgan uch yo'nalishli strategiyani qo'llashdir
Korxona strategiyasi : Bu erda biz texnik, shu jumladan, hozirgi me'morchilik va vositalarni aniqlaymiz. Shuningdek, biz faktlar, o'lchamlar va atributlarni aniqlaymiz. Ma'lumotlarni xaritalash va o'zgartirish ham o'tkaziladi.
Bosqichli etkazib berish : Ma'lumotlar omborini amalga oshirish mavzu yo'nalishlari asosida bosqichma-bosqich amalga oshirilishi kerak. Bronlash va hisob-kitob qilish kabi tegishli biznes sub'ektlari dastlab amalga oshirilishi va keyin bir-biri bilan birlashtirilishi kerak.
Iterativ prototiplash : amalga oshirishda katta portlash yondashuvidan ko'ra, ma'lumotlar omborini ishlab chiqish va takroriy ravishda sinab ko'rish kerak.
Datawarehouse-ni amalga oshirishdagi muhim qadamlar va uning natijalari.
Data Warehouseni amalga oshirish bo'yicha eng yaxshi amaliyot
Ma'lumotlarning izchilligi, aniqligi va yaxlitligini sinash uchun reja tuzing.
Data Warehouse yaxshi birlashtirilgan, aniq belgilangan va vaqt bilan muhrlangan bo'lishi kerak.
Ma'lumotlar omborini loyihalashda to'g'ri vositadan foydalanganingizga, hayot tsikliga rioya qilganingizga, ma'lumotlar ziddiyatlari haqida qayg'urganingizga ishonch hosil qiling va xatolaringizni bilib olishga tayyor bo'ling.
Operatsion tizimlar va hisobotlarni hech qachon almashtirmang
Ma'lumotlarni yig'ish, tozalash va yuklashga ko'p vaqt sarflamang.
Ma'lumotlar omborini amalga oshirish jarayonida barcha manfaatdor tomonlarni, shu jumladan biznes xodimlarini jalb qilishni ta'minlang. Ma'lumotlar ombori qo'shma / jamoaviy loyiha ekanligini aniqlang. Oxirgi foydalanuvchilar uchun foydali bo'lmagan ma'lumotlar omborini yaratishni xohlamaysiz.
Oxirgi foydalanuvchilar uchun o'quv rejasini tayyorlang.
Data Warehouse nima uchun kerak? Afzalliklari va kamchiliklari
Data Warehouse afzalliklari (DWH):
Data Warehouse ishbilarmon foydalanuvchilarga ba'zi manbalardan olingan muhim ma'lumotlarni bir joyda tezda olish imkoniyatini beradi.
Data Warehouse ishbilarmon foydalanuvchilarga ba'zi manbalardan olingan muhim ma'lumotlarni bir joyda tezda olish imkoniyatini beradi.
Data Warehouse turli xil o'zaro faoliyat funktsiyalar bo'yicha doimiy ma'lumotlarni taqdim etadi. Shuningdek, u vaqtinchalik hisobot va so'rovlarni qo'llab-quvvatlaydi.
Data Warehouse ishlab chiqarish tizimidagi stressni kamaytirish uchun ko'plab ma'lumot manbalarini birlashtirishga yordam beradi.
Ma'lumotlar ombori tahlil qilish va hisobot berish uchun umumiy aylanish vaqtini qisqartirishga yordam beradi.
Qayta qurish va integratsiya foydalanuvchiga hisobot va tahlil uchun foydalanishni osonlashtiradi.
Ma'lumotlar ombori foydalanuvchilarga bitta joyda manbalar sonidan muhim ma'lumotlarga kirish imkoniyatini beradi. Shuning uchun, bu foydalanuvchining bir nechta manbalardan ma'lumotlarni olish vaqtini tejaydi.
Ma'lumotlar ombori ko'plab tarixiy ma'lumotlarni saqlaydi. Bu foydalanuvchilarga kelajakda bashorat qilish uchun turli xil davrlar va tendentsiyalarni tahlil qilishga yordam beradi.
Data Warehousening kamchiliklari:
Tuzilmasiz ma'lumotlar uchun ideal variant emas.
Ma'lumotlar omborini yaratish va amalga oshirish vaqtni chalkashtirib yuboradigan ish.
Ma'lumotlar ombori nisbatan tez eskirishi mumkin
Ma'lumot turlari va diapazonlari, ma'lumotlar manbalari sxemasi, indekslar va so'rovlarga o'zgartirish kiritish qiyin.
Ma'lumotlar ombori oson ko'rinishi mumkin, ammo aslida oddiy foydalanuvchilar uchun bu juda murakkab.
Loyihani boshqarish bo'yicha barcha sa'y-harakatlarga qaramay, ma'lumotlar omborini saqlash loyihasi hajmi doimo oshib boradi.
Qachondir ombor foydalanuvchilari turli xil biznes qoidalarini ishlab chiqishadi.
Tashkilotlar o'zlarining ko'plab mablag'larini o'qitish va amalga oshirish maqsadida sarflashlari kerak.
Ma'lumotlarni saqlashning kelajagi
Normativ cheklovlarning o'zgarishi turli xil ma'lumotlar manbasini birlashtirish imkoniyatini cheklashi mumkin. Ushbu xilma-xil manbalarga saqlash uchun qiyin bo'lgan tuzilmaviy ma'lumotlar kirishi mumkin.
As hajmi bazalarni o'sadi, juda katta ma'lumotlar bazasini tashkil nima bashorat o'sishi davom etmoqda. Har doim kattalashib boradigan ma'lumotlar omborlari tizimlarini qurish va ishlatish juda murakkab. Bugungi kunda mavjud bo'lgan apparat va dasturiy ta'minot ko'p miqdordagi ma'lumotlarni Internetda saqlashga imkon bermaydi.
Multimedia ma'lumotlarini matnli ma'lumotlar sifatida boshqarish oson emas, matnli ma'lumotni esa bugungi kunda mavjud bo'lgan relyatsion dastur yordamida olish mumkin. Bu tadqiqot mavzusi bo'lishi mumkin.
Data Warehouse ivositalari
Bozorda ko'plab ma'lumotlar omborlari vositalari mavjud. Mana, eng taniqli biri:
1. MarkLogic:
MarkLogic ma'lumotlar omborini saqlashning foydali echimi bo'lib, u bir qator korporativ funktsiyalar yordamida ma'lumotlarni birlashtirishni osonlashtiradi va tezlashtiradi. Ushbu vosita juda murakkab qidiruv operatsiyalarini bajarishga yordam beradi. U hujjatlar, munosabatlar va metama'lumotlar kabi har xil turdagi ma'lumotlarni so'rashi mumkin.
https://developer.marklogic.com/products/
2. Oracle:
Oracle - bu sanoatning etakchi ma'lumotlar bazasi. Bu bino ichida ham, bulutda ham ma'lumotlar ombori echimlarini tanlashning keng doirasini taklif etadi. Bu operatsion samaradorlikni oshirish orqali mijozlar tajribasini optimallashtirishga yordam beradi.
https://www.oracle.com/index.html
3. Amazon RedShift:
Amazon Redshift - bu ma'lumotlar ombori vositasi. Bu standart SQL va mavjud bo'lgan BI vositalari yordamida barcha turdagi ma'lumotlarni tahlil qilish uchun oddiy va tejamli vosita. Shuningdek, so'rovlarni optimallashtirish texnikasidan foydalangan holda petabaytli tuzilgan ma'lumotlarga qarshi murakkab so'rovlarni o'tkazishga imkon beradi.
https://aws.amazon.com/redshift/?nc2=h_m1
Bu erda foydali ma'lumotlar bazasi vositalarining to'liq ro'yxati keltirilgan .
Asosiy ma'lumot
Ma'lumotlar ombori (DWH), shuningdek, Enterprise Data Warehouse (EDW) sifatida tanilgan.
Ma'lumotlar ombori ma'lumotlar bir yoki bir nechta ma'lumot manbalaridan kelib chiqadigan markaziy ombor sifatida tavsiflanadi.
Ma'lumotlar omborlarining uchta asosiy turi bu Enterprise Data Warehouse (EDW), Operatsion Data Store va Data Mart.
Ma'lumotlar omborining umumiy holati: Oflayn operatsion ma'lumotlar bazasi, Oflayn ma'lumotlar ombori, Haqiqiy vaqtda ma'lumotlar ombori va Integratsiyalashgan ma'lumotlar ombori.
Datawarehouse-ning to'rtta asosiy komponentlari yuk menejeri, ombor menejeri, so'rovlar menejeri, oxirgi foydalanuvchiga kirish vositalari
Ma'lumotlar ombori aviakompaniya, bank, sog'liqni saqlash, sug'urta, chakana savdo va boshqalar kabi turli sohalarda qo'llaniladi.
Datawarehosue dasturini amalga oshirish - bu uchta asosiy strategiya. Korxona strategiyasi, bosqichma-bosqich etkazib berish va takroriy prototip yaratish.
Ma'lumotlar ombori ishbilarmon foydalanuvchilarga ba'zi manbalardan olingan muhim ma'lumotlarni bir joyda tezda olish imkoniyatini beradi.