Kerakli ma'lumotlar miqdorini aniqlash. Kerakli ma'lumotlar miqdorini aniqlashda ma'lumotlar buyurtma qilingan yoki yo'qligini hisobga olish kerak.
Agar ma'lumotlar buyurtma qilingan bo'lsa va biz vaqt seriyasi bilan ishlayotgan bo'lsak, bunday ma'lumotlar to'plami mavsumiy/tsiklik komponentni o'z ichiga oladimi yoki yo'qligini bilish maqsadga muvofiqdir. Agar maʼlumotlar toʻplamida mavsumiy/sikl komponenti mavjud boʻlsa, kamida bitta fasl/sikl mavjud boʻlishi kerak.
Agar ma'lumotlar tartiblanmagan bo'lsa, ya'ni ma'lumotlar to'plamidagi hodisalar o'z vaqtida bog'liq bo'lmasa, ma'lumotlarni yig'ishda quyidagi qoidalarga rioya qilish kerak.
To'plamdagi yozuvlar soni. Ma'lumotlar to'plamidagi yozuvlar sonining etarli emasligi noto'g'ri modelni yaratishga olib kelishi mumkin. Statistik nuqtai nazardan, modelning aniqligi tekshirilayotgan ma'lumotlarning miqdori bilan ortadi. Ehtimol, ba'zi ma'lumotlar eskirgan yoki qandaydir atipik vaziyatni tavsiflaydi va ularni ma'lumotlar bazasidan chiqarib tashlash kerak. Juda katta ma'lumotlar bazalarida modellar yaratishda foydalaniladigan algoritmlar kengaytiriladigan bo'lishi kerak.
To'plamdagi yozuvlar soni va kiritilgan o'zgaruvchilar sonining nisbati. Ko'pgina algoritmlardan foydalanganda, kirish o'zgaruvchilari va kuzatishlar sonining ma'lum (kerakli) nisbati zarur. Ma'lumotlar to'plamidagi yozuvlar (misollar) soni omillar (o'zgaruvchilar) sonidan sezilarli darajada ko'p bo'lishi kerak.
Ma'lumotlar to'plami reprezentativ bo'lishi va iloji boricha ko'proq vaziyatlarni aks ettirishi kerak. Ma'lumotlar to'plamidagi turli xil misollarni ko'rsatish nisbati haqiqiy vaziyatga mos kelishi kerak.
Ma'lumotlarni oldindan qayta ishlash . Sifatli va sifatsiz ma'lumotlarni tahlil qilish mumkin. Natija ikkala holatda ham erishiladi. Sifatli tahlilni ta'minlash uchun ma'lumotlarni dastlabki qayta ishlashni amalga oshirish kerak, bu Ma'lumotlarning zaruriy bosqichidir. Kon .
Ma'lumotlar sifatini baholash. Yig'ish natijasida olingan ma'lumotlar ma'lum sifat mezonlariga javob berishi kerak. Shunday qilib, ma'lumotlar jarayonining muhim kichik bosqichini ajratib ko'rsatish mumkin Mining - ma'lumotlar sifatini baholash.
Ma'lumotlar sifati ( Ma'lumotlar sifat ) - ma'lumotlarning to'liqligi, aniqligi, o'z vaqtida va izohlanishini belgilovchi mezon.
Ma'lumotlar yuqori sifatli yoki past sifatli bo'lishi mumkin, ikkinchisi iflos yoki "yomon" ma'lumotlar deb ataladi.
Yuqori sifatli ma'lumotlar to'liq, aniq, o'z vaqtida talqin qilinishi mumkin bo'lgan ma'lumotlardir.
Bunday ma'lumotlar sifatli natija beradi: qaror qabul qilish jarayonini qo'llab-quvvatlay oladigan bilim.
Prognoz. Ko'pgina kompaniyalar ma'lumotlar sifatiga ko'proq e'tibor berishni boshladilar, chunki sifatsiz sifat unumdorlikning pasayishiga, noto'g'ri biznes qarorlar qabul qilinishiga va kerakli natijaga erisha olmaslikka olib keladi, shuningdek, qonuniy talablarga rioya qilishni qiyinlashtiradi. Shu sababli, kompaniyalar haqiqatan ham ma'lumotlar sifati bilan bog'liq muammolarni hal qilish uchun aniq choralar ko'rish niyatida.
Haqiqat. Bu tendentsiya, ayniqsa, moliyaviy xizmatlar sohasida davom etmoqda. Avvalo, bu Bazel II kelishuviga rioya qilishga urinayotgan kompaniyalarga tegishli. Sifatsiz ma'lumotlardan kreditlarni baholash va tashkilotning kapitalga bo'lgan talablarini hisoblash uchun foydalaniladigan risklarni baholash tizimlarida foydalanish mumkin emas. Shunisi qiziqki, ma'lumotlar sifati muammosini hal qilish bo'yicha qarashlar sezilarli darajada o'zgargan. Dastlab, menejerlar sifatni baholash vositalariga e'tibor qaratdilar, chunki ma'lumotlarning "egasi" muammoni manba darajasida, masalan, ma'lumotlarni tozalash va xodimlarni qayta tayyorlash orqali hal qilishi kerak, deb hisoblardi. Ammo endi ularning qarashlari sezilarli darajada o'zgardi. Ma'lumotlar sifati tushunchasi birinchi bosqichda ularni tizimga ehtiyotkorlik bilan kiritishdan ko'ra ancha kengroqdir. Bugungi kunda ko'pchilik ma'lumotlar sifatini qazib olish, o'zgartirish va yuklash ( Extraction , Transformation , Loading - ETL) jarayonlari, shuningdek, ma'lumotlarni tahlil qilish uchun tayyorlaydigan manbalardan ma'lumotlarni olish bilan ta'minlash kerakligini tushunadi.
Ma'lumotlar sifati tushunchasini batafsilroq ko'rib chiqing. Sifatsiz ma'lumotlar yoki iflos ma'lumotlar - bu etishmayotgan, noto'g'ri yoki amaliy qo'llash nuqtai nazaridan foydasiz ma'lumotlar (masalan, standartga mos kelmaydigan noto'g'ri formatda taqdim etilgan). Nopok ma'lumotlar bugungi kunda paydo bo'lmadi, ular ma'lumotlarni kiritish tizimlari bilan bir vaqtda paydo bo'ldi.
Nopok ma'lumotlar turli sabablarga ko'ra paydo bo'lishi mumkin, masalan, ma'lumotlarni kiritishda xatolik, turli taqdimot formatlari yoki o'lchov birliklaridan foydalanish, standartlarga rioya qilmaslik, o'z vaqtida yangilanmaslik, ma'lumotlarning barcha nusxalarini muvaffaqiyatsiz yangilash, takroriy yozuvlarni muvaffaqiyatsiz olib tashlash va h.k. Nopok ma'lumotlarga ega bo'lish narxini baholash kerak; boshqacha qilib aytganda, iflos ma'lumotlarning mavjudligi haqiqatan ham moliyaviy yo'qotishlarga olib kelishi mumkin va agar uning mavjudligi oldini olmasa yoki aniqlanmasa va tozalanmasa, yuridik javobgarlikka olib kelishi mumkin.
Nopok ma'lumotlar bilan batafsilroq tanishish uchun 33 turdagi iflos ma'lumotlarning taksonomiyasi qayerda taqdim etilishini va ma'lumotlarni oldini olish yoki tanib olish va tozalash usullarining taksonomiyasini ishlab chiqishni tavsiya qilish mumkin. Har xil turdagi iflos ma'lumotlar tavsiflanadi, ular orasida quyidagi guruhlar ajratiladi:
avtomatik ravishda aniqlanishi va tozalanishi mumkin bo'lgan iflos ma'lumotlar;
oldini olish mumkin bo'lgan ma'lumotlar;
tozalash uchun mos bo'lmagan ma'lumotlar ;
oldini olish mumkin bo'lmagan ma'lumotlar.
Shuning uchun, maxsus tozalash vositalari har qanday iflos ma'lumotlarga dosh bera olmasligini tushunish muhimdir.
Nopok ma'lumotlarning eng keng tarqalgan turlarini ko'rib chiqing:
etishmayotgan qiymatlar;
takroriy ma'lumotlar;
shovqin va emissiya.
etishmayotgan qiymatlar ( Yo'qolgan Qiymatlar ) .
ma'lumotlar umuman yig'ilmagan (masalan, so'rovnomada yosh yashiringan);
ba'zi atributlar ba'zi ob'ektlarga taalluqli bo'lmasligi mumkin (masalan, "yillik daromad" atributi bolaga taalluqli emas).
Yo'qolgan ma'lumotlar bilan qanday kurashishimiz mumkin?
Qiymatlari etishmayotgan ob'ektlarni qayta ishlashdan chiqarib tashlang.
Yo'qolgan ma'lumotlar uchun yangi qiymatlarni hisoblang.
Tahlil paytida etishmayotgan qiymatlarga e'tibor bermang.
Yo'qolgan qiymatlarni mumkin bo'lgan qiymatlar bilan almashtiring.
Ikki nusxadagi ma'lumotlar ( dublikat ma'lumotlar ).
Ma'lumotlar to'plami takrorlangan ma'lumotlarni o'z ichiga olishi mumkin, ya'ni. dublikatlar. Ikki nusxadagi yozuvlar barcha atributlar uchun bir xil qiymatga ega yozuvlardir. Ma'lumotlar to'plamida dublikatlarning mavjudligi ba'zi yozuvlarning ahamiyatini oshirishning bir usuli bo'lishi mumkin. Bunday ehtiyoj ba'zan ma'lumotlar to'plamidan ma'lum yozuvlarni alohida ta'kidlash uchun paydo bo'ladi. Biroq, ko'p hollarda, takroriy ma'lumotlar ma'lumotlarni tayyorlash xatolarining natijasidir.
Ikki nusxadagi ma'lumotlar bilan qanday kurashishimiz mumkin? Dublikatlarni qayta ishlashning ikkita varianti mavjud. Birinchi variant dublikatlarni o'z ichiga olgan barcha yozuvlar guruhini olib tashlaydi. Ushbu parametr dublikatlarning mavjudligi ma'lumotlarga ishonchsizlikni keltirib chiqarsa, uni butunlay qadrsizlantirsa ishlatiladi.
Ikkinchi variant - dublikatlar guruhini bitta noyob yozuv bilan almashtirish:
Shovqin va emissiya.
Chiqib ketishlar ma'lumotlar to'plamidagi keskin farq qiluvchi xususiyatlar yoki kuzatuvlardir . Shovqin va chetdagi ko'rsatkichlar ma'lumotlarni tahlil qilishda juda keng tarqalgan muammodir. Chiqib ketishlar individual kuzatishlarni ifodalashi yoki muayyan guruhlarga birlashtirilishi mumkin. Tahlilchining vazifasi nafaqat ularni aniqlash, balki keyingi tahlil natijalariga ta'sir darajasini baholashdir. Agar chet ko'rsatkichlar tahlil qilingan ma'lumotlar to'plamining informatsion qismi bo'lsa, ishonchli usullar va protseduralar qo'llaniladi.
Turli ma'lumotlar usullari Tog'larni qazib olish usullari tashqi ko'rsatkichlarga nisbatan har xil sezgirlikka ega , ma'lumotlarni tahlil qilish usulini tanlashda bu haqiqatni hisobga olish kerak. Shuningdek, ba'zi ma'lumotlar vositalari Tog' -kon sanoatida shovqin va chiqindilar uchun o'rnatilgan tozalash tartib -qoidalari mavjud.
Ma'lumotlarni vizualizatsiya qilish sizga ma'lumotlarni, shu jumladan emissiyalarni grafik shaklda taqdim etish imkonini beradi. Biz boshqalardan juda farq qiladigan bir nechta kuzatuvlarni ko'ramiz (ular ko'pchilik kuzatuvlardan juda uzoqda joylashgan).
1-qadam. Ma'lumotlarni tahlil qilish. Ma'lumotlarning batafsil tahlili olib tashlanishi kerak bo'lgan xatolar va nomuvofiqliklar turlarini aniqlash uchun zarur. Bu erda siz ma'lumotlarni qo'lda tekshirish yoki ularning shablonlari, shuningdek, ma'lumotlar xususiyatlari haqida metama'lumotlarni olish va sifat muammolarini aniqlash uchun maxsus dasturlardan foydalanishingiz mumkin.
2-qadam. Ma'lumotlarni o'zgartirish tartibi va qoidalarini aniqlash. Ma'lumotlar manbalari soniga, heterojenlik darajasiga va ifloslanish darajasiga qarab, ma'lumotlar juda keng qamrovli o'zgartirish va tozalashni talab qilishi mumkin. Sxema tarjimasi ba'zan umumiy ma'lumotlar modelining manbalarini ko'rsatish uchun ishlatiladi ; Ma'lumotlar omborlari uchun odatda relyatsion vakillik ishlatiladi. Birinchi tozalash bosqichlari alohida ma'lumotlar manbalarining muammo tavsifini aniqlashtirishi yoki o'zgartirishi va ma'lumotlarni integratsiyaga tayyorlashi mumkin. Keyingi qadamlar sxema/ma'lumotlar integratsiyasi va dublikatlar kabi bir nechta element muammolarini bartaraf etishga qaratilgan bo'lishi kerak. Omborlar uchun ETL ta'rifi ishi boshqaruv usullarini va o'zgartirilishi va tozalanishi kerak bo'lgan ma'lumotlar oqimini belgilashi kerak .
Sxema bilan bog'liq ma'lumotlarni o'zgartirish, shuningdek tozalash bosqichlari iloji boricha deklarativ so'rov va xaritalash tilidan foydalangan holda aniqlanishi kerak , bu esa transformatsiya kodini avtomatik ravishda yaratishni ta'minlaydi. Bundan tashqari, konvertatsiya qilish jarayonida foydalanuvchi tomonidan yozilgan tozalash kodini va maxsus vositalarni ishga tushirish imkoniyati bo'lishi kerak. O'tkazish bosqichlari o'rnatilgan tozalash mantig'i mavjud bo'lmagan ma'lumotlar elementlari bo'yicha foydalanuvchi fikr-mulohazalarini talab qilishi mumkin.
3-qadam. Tasdiqlash. Ushbu bosqich transformatsiya jarayoni va ta'riflarning to'g'riligi va samaradorligini belgilaydi. Bu, masalan, misolda yoki manba ma'lumotlarining nusxasida, ushbu ta'riflarni biron-bir tarzda yaxshilash zarurligini tekshirish va baholash orqali amalga oshiriladi. Tahlil qilish, loyihalash va tasdiqlash ko'p takrorlashni talab qilishi mumkin, masalan, ba'zi xatolar faqat ma'lum transformatsiyalar amalga oshirilgandan keyin ko'rinadi.
4-qadam. Transformatsiyalar. Bu bosqichda maʼlumotlar omborini yuklash va yangilash uchun ETL jarayonida yoki bir nechta manbalar boʻyicha soʻrovlarga javob berishda oʻzgarishlar amalga oshiriladi.
5-qadam: Tozalangan ma'lumotlarning teskari oqimi. Alohida manba xatolari olib tashlanganidan so'ng, asl manbalardagi ifloslangan ma'lumotlar toza ma'lumotlar bilan almashtirilishi kerak, shunda yaxshilangan ma'lumotlar eski ilovalarga ham etib boradi va olinganda qo'shimcha tozalashni talab qilmaydi. Vaults uchun tozalangan ma'lumotlar ma'lumotlarni saqlash maydonida joylashgan.
Ushbu konvertatsiya jarayoni katta hajmdagi metama'lumotlarni (sxemalar, sxema darajasidagi ma'lumotlar xususiyatlari, ish oqimi ta'riflari va boshqalar) talab qiladi. Boshqa hollarda barqarorlik, moslashuvchanlik va foydalanish qulayligi uchun ushbu metama'lumotlar DBMSga asoslangan omborda saqlanishi kerak. Ma'lumotlar sifatini saqlab qolish uchun transformatsiya jarayonining tafsilotlari ham omborda , ham o'zgartirilgan ma'lumotlar ob'ektlarida, xususan, asl ma'lumotlarning to'liqligi va yangiligi va o'zgartirilgan ob'ektlarning asl manbasi haqidagi ma'lumotlarning kelib chiqishi to'g'risidagi ma'lumotlar yozilishi kerak. ularga kiritilgan o'zgarishlar.
Quyida ma'lumotlarni tahlil qilishning mumkin bo'lgan usullari (nizolarni aniqlash), o'zgarishlarni aniqlash va nizolarni hal qilish batafsil tavsiflanadi. Nomlash ziddiyatlari odatda nomni o'zgartirish orqali hal qilinadi; tarkibiy ziddiyatlar qisman qayta qurish va dastlabki sxemalarni birlashtirishni talab qiladi.
Algoritmlarni tahlil qilishda kirish ma'lumotlarining o'rni juda katta, chunki algoritmning harakatlar ketma-ketligi faqat kirish ma'lumotlari bilan belgilanadi. Masalan, N ta elementdan iborat roʻyxatdagi eng katta elementni topish uchun quyidagi algoritmdan foydalanishingiz mumkin:
max=list[0]
for( int i =0:i< n;i ++)
if (ro'yxat [ i ] > Maks) then Maks = list[ i ]
Ko'rinib turibdiki, agar ro'yxat kamayish tartibida tartiblangan bo'lsa, u holda tsikl boshlanishidan oldin bitta topshiriq bajariladi va tsiklning tanasida hech qanday topshiriq bo'lmaydi. Agar ro'yxat o'sish tartibida bo'lsa, u holda jami N ta topshiriq bo'ladi (bir tsikl boshlanishidan oldin va N - 1 tsiklda).
Tahlil qilishda biz kirish qiymatlarining turli xil to'plamlarini ko'rib chiqishimiz kerak, chunki agar biz o'zimizni bitta to'plam bilan cheklasak, u eng tez (yoki eng sekin) yechim bo'lishi mumkin. Natijada, biz algoritm haqida noto'g'ri tasavvurga ega bo'lamiz. Buning o'rniga biz kirish to'plamlarining barcha turlarini ko'rib chiqamiz. Biz har bir to'plamdagi algoritmning xatti-harakatiga qarab turli xil kirish to'plamlarini sinflarga bo'lishga harakat qilamiz. Bunday bo'linish ko'rib chiqilayotgan imkoniyatlar sonini kamaytirishga imkon beradi.
Masalan, ro'yxatdagi 10 xil sonning har xil joylashuvi soni 10 ta!= 3 628 800. 10 ta sondan iborat ro'yxatga eng katta elementni topish algoritmini qo'llaymiz. Birinchi soni eng katta bo'lgan 362 880 ta kirish to'plami mavjud; ularning barchasi bitta sinfga joylashtirilishi mumkin. Agar eng katta raqam ikkinchi o'rinda bo'lsa, u holda algoritm aniq ikkita topshiriqni bajaradi. Eng katta raqam ikkinchi o'rinda turadigan to'plamlar 362 880. Ularni boshqa sinfga belgilash mumkin. Eng katta sonning o'rni 1 dan N ga o'zgarganda topshiriqlar soni qanday o'zgarishini ko'rish mumkin.
Shunday qilib, biz barcha kirish to'plamlarini topshiriqlar soniga qarab N xil sinfga bo'lishimiz kerak. Ko'rib turganingizdek, har bir sinfda belgilangan barcha to'plamlarni yozish yoki batafsil tavsiflashning hojati yo'q. Siz faqat sinflar sonini va har bir sinf to'plamidagi ish hajmini bilishingiz kerak. Mumkin bo'lgan kirishlar soni N ortishi bilan juda kattalashishi mumkin.Masalan, ro'yxatda 10 xil raqamni 3,628,800 ta usulda joylashtirish mumkin. Bularning barchasini ko'rib chiqish mumkin emas: yo'llar. Buning o'rniga, biz algoritm nima qilishiga qarab ro'yxatlarni sinflarga ajratamiz.
Yuqoridagi algoritm uchun bo'linish eng katta qiymatning joylashuviga asoslanadi. Natijada 10 xil sinf mavjud. Boshqa algoritm uchun, masalan, eng katta va eng kichik qiymatni topish algoritmi, bizning bo'linishimiz eng katta va eng kichik qiymatlar joylashgan joyga asoslangan bo'lishi mumkin. Ushbu bo'limda 90 ta sinf mavjud. Sinflarni ajratganimizdan so'ng, har bir sinfdan bitta to'plamda algoritmning harakatini ko'rib chiqishimiz mumkin. Agar sinflar to'g'ri tanlangan bo'lsa, u holda bitta sinfning kirish ma'lumotlarining barcha to'plamlarida algoritm bir xil miqdordagi operatsiyalarni bajaradi va boshqa sinf to'plamlarida bu operatsiyalar soni katta ehtimol bilan farq qiladi.
Ma'lumotlar strukturasi - ma'lumotlar elementlari to'plami va ular orasidagi munosabatlar to'plami . Algoritmlarda bo'lgani kabi, ularning ko'plari mavjud va har biri o'z vazifalari sohasida qo'llaniladi. Ko'pgina ilovalarni amalga oshirish uchun ma'lumotlar tuzilmasini tanlash eng muhim qaror hisoblanadi: tanlov amalga oshirilgandan so'ng, algoritmlarni ishlab chiqish qiyin emas. Xuddi shu ma'lumotlar uchun turli tuzilmalar turli xil disk maydonini egallaydi. Turli xil ma'lumotlar tuzilmalari bilan bir xil operatsiyalar teng bo'lmagan samaradorlik algoritmlarini yaratadi. Shuning uchun algoritmlarni tanlash ma'lumotlar strukturasini tanlash bilan chambarchas bog'liq.
Ma'lumotlar tuzilmalarini tasniflash turli mezonlar bo'yicha amalga oshirilishi mumkin :
taqdimot yo'li bilan;
ma'lumotlarni saqlash uchun ishlatiladigan xotira turi bo'yicha;
taqdimotning murakkabligi bilan;
strukturadagi elementlarning tartiblanishi tabiati bo'yicha;
o'zgaruvchanlik bo'yicha.
Ma'lumotlarni taqdim etish usuli. Ma'lumotlarning jismoniy va mantiqiy (mavhum) tuzilmalari mavjud. Ma'lumotlarning jismoniy tuzilishi - bu ma'lumotlarni kompyuterning mashina xotirasida aks ettirish (saqlash) usuli. Mantiqiy struktura - bu ma'lumotlar strukturasini mashina xotirasida aks ettirishdan qat'i nazar, ko'rib chiqish. Umumiy holda, mantiqiy va mos keladigan jismoniy tuzilmalar o'rtasida tafovutlar mavjud bo'lib, ular strukturaning o'zi va uni amalga oshirish kerak bo'lgan muhitning xususiyatlari bilan belgilanadi.
Mantiqiy tuzilmani jismoniy va aksincha, jismoniy tuzilmani mantiqiy tuzilma bilan taqqoslaydigan protseduralar mavjud. Ma'lumotlarni saqlash uchun ishlatiladigan xotira turi. Jismoniy tuzilmalarni joylashtirishga va shunga mos ravishda ularga kirishga qarab, ichki va tashqi ma'lumotlar tuzilmalari farqlanadi.
Ichki tuzilmalar - bu kompyuterning statik va dinamik xotirasida joylashgan ma'lumotlar. Tashqi tuzilmalar tashqi qurilmalarda joylashgan va fayl tuzilmalari yoki fayllar deb ataladi. Fayl tuzilmalariga misollar: fayllar, B-daraxtlar va boshqalar.
Ma'lumotlarni taqdim etishning murakkabligi . Ma'lumotlar tuzilmalari elementar va kompozitga bo'linadi. Elementar ma'lumotlar tuzilmalari - bu ularning tarkibiy qismlariga bo'linib bo'lmaydigan tuzilmalar. Jismoniy tuzilma nuqtai nazaridan, ma'lum bir mashina arxitekturasida, muayyan dasturlash tizimida ma'lumotlarning elementar birligining o'lchami qanday bo'lishini va qanday bo'lishini har doim oldindan aytish mumkinligi muhimdir. xotirasiga joylashtirilgan. Mantiqiy nuqtai nazardan, ma'lumotlarning elementar birliklari bo'linmaydi.
Kompozit ma'lumotlar tuzilmalari qismlarga bo'linishi mumkin bo'lganlar - boshqa (elementar yoki kompozit) ma'lumotlar tuzilmalari. Kompozit ma'lumotlar tuzilmalari dasturchi tomonidan dasturlash tillari tomonidan taqdim etilgan ma'lumotlarni integratsiyalash vositalaridan foydalangan holda tuziladi. Strukturadagi elementlarning tartiblanishi tabiati. Kompozit ma'lumotlar strukturasining muhim xususiyati uning qismlarini tartiblash xususiyatidir. Shu asosda tuzilmalarni chiziqli va chiziqli bo'lmaganlarga bo'lish mumkin. Chiziqli tuzilmalar xotiradagi elementlarning ketma-ket joylashuvi (vektorlar, satrlar, massivlar, steklar, navbatlar) va xotiradagi elementlarning o'zboshimchalik bilan bog'langan taqsimlanishiga ega bo'lgan tuzilmalarga bo'linadi, ular bitta va ikkilamchi bog'langan chiziqli ro'yxatlarni o'z ichiga oladi. Nochiziqli tuzilmalar - bog'langan ro'yxatlar, daraxtlar, grafiklar.
Ma'lumotlarning o'zgaruvchanligi. O'zgaruvchanlik elementlar sonining o'zgarishi va / yoki strukturaning tarkibiy qismlari o'rtasidagi munosabatlar bilan belgilanadi. Strukturaning o'zgaruvchanligi ta'rifi ma'lumotlar elementlarining qiymatlari o'zgarganligini hisobga olmaydi, chunki bu holda barcha ma'lumotlar tuzilmalari o'zgaruvchanlik xususiyatiga ega bo'ladi. O'zgaruvchanlik asosida statik va dinamik tuzilmalar ajratiladi. Statik, masalan, massivlar, to'plamlar, yozuvlar, jadvallar; dinamik - bog'langan ro'yxatlar, grafiklar, daraxtlar.
Ma'lumotlar tuzilmalari bo'yicha operatsiyalar. Ko'pgina algoritmlarda qo'llaniladigan amallar to'plami elementlarni to'plamga kiritish, ularni olib tashlash, shuningdek, element to'plamga tegishli yoki yo'qligini tekshirish qobiliyati bilan cheklangan. Ushbu operatsiyalarni qo'llab-quvvatlaydigan dinamik to'plam lug'at deb ataladi . Ba'zi turdagi dinamik to'plamlarda ob'ektning maydonlaridan biri kalit ( kalit ) sifatida aniqlanadi. maydon ). Agar barcha kalitlar boshqacha bo'lsa, dinamik to'plamni kalit qiymatlar to'plami sifatida ko'rsatish mumkin. Ba'zan ob'ekt tegishli ma'lumotlarni o'z ichiga oladi ( sun'iy yo'ldosh ma'lumotlar ) uning boshqa sohalarida bo'lgan, lekin o'rnatilgan amalga oshirish tomonidan foydalanilmaydi. Bundan tashqari, ob'ekt o'rnatilgan operatsiyalar davomida manipulyatsiya qilinishi mumkin bo'lgan maydonlarni o'z ichiga olishi mumkin; ba'zan bu maydonlar to'plamdagi boshqa ob'ektlarga ma'lumotlar yoki ko'rsatkichlarni saqlaydi. Ma'lumotlar tuzilmalari to'plamida so'rovlarga ( so'rovlar ) bo'lingan operatsiyalar to'plami mavjud bo'lib, ular to'plam haqida ma'lumotni qaytaradi va operatsiyalarni o'zgartirish ( o'zgartirish ). to'plamni o'zgartiradigan operatsiyalar ).
Quyida odatiy operatsiyalar ro'yxati keltirilgan:
berilgan qiymatga ega bo'lgan elementni to'plamda qidirish;
to'plamga berilgan qiymatga ega elementni qo'shish;
berilgan qiymatga ega bo'lgan elementni to'plamdan olib tashlash;
to'plamda eng kichik qiymatga ega elementni qidirish;
to'plamda eng katta qiymatga ega elementni qidiring.
Do'stlaringiz bilan baham: |