Raqamli datasetlar: Unda ma'lumotlar tabiiy tilda emas, balki raqamlarda ifodalanadi.
Ikki o’zgaruvchili datasetlar: Ikki o'zgaruvchiga ega bo'lgan ma'lumotlar to'plami
Bivariativ ma'lumotlar to'plami deb ataladi. Bu ikki o'zgaruvchi o'rtasidagi munosabat
bilan shug'ullanadi. Ikki o'zgaruvchan ma'lumotlar to'plami odatda ikki turdagi tegishli
ma'lumotlarni o'z ichiga oladi.
Ko’p o’zgaruvchili datasetlar: Bir nechta o'zgaruvchilarga ega ma'lumotlar to'plami.
Agar ma'lumotlar to'plami uchta yoki uchtadan ortiq ma'lumotlar turlarini (o'zgaruvchilari)
o'z ichiga olsa, u holda ma'lumotlar to'plami ko'p o'zgaruvchan ma'lumotlar to'plami deb
ataladi. Boshqacha qilib aytganda, ko'p o'zgaruvchan ma'lumotlar to'plami uchta yoki
uchtadan ortiq o'zgaruvchilar funktsiyasi sifatida olingan individual o'lchovlardan iborat.
Kategorikal datasetlar
Korrelyatsion datasetlar
Dataset formatlari
|
|
|
10
|
Korrelatsiya koeffitsienti tushunchasi va uning qo‘llanilish sohalari.
|
|
|
|
Korrelyatsiya koeffitsienti statistikada bu X va Y miqdoriy o'zgaruvchilarining ular orasidagi chiziqli yoki mutanosib bog'liqlik tendentsiyasini o'lchaydigan ko'rsatkichdir.
Regressiyadan farqli o'laroq, korrelyatsiya qiymatlarni bashorat qilishga imkon
bermaydi.Odatda, X va Y o'zgaruvchilar juftligi bir xil populyatsiyaning ikkita xususiyati.
Masalan, X odamning bo‘yi va uning vazni Y bo‘lishi mumkin.
Miqdorlar orasidagi munosabatni topishning bu usuli statistikada keng qo'llaniladi.
|
|
|
11
|
Bir o‘zgaruvchili chiziqli regressiya algoritmi.
|
|
|
|
Biz regressiya tahlili haqida gapira boshlaganimizda, asosiy maqsad har doim bizning so'rovimiz doirasidagi o'zgaruvchilar o'rtasidagi asosiy munosabatlarni tasavvur qilishimizga yordam beradigan modelni ishlab chiqishdir. Bir o'zgaruvchan chiziqli regressiya bitta mustaqil (tushuntiruvchi o'zgaruvchi) va bitta qaram o'zgaruvchi o'rtasidagi munosabatni aniqlashga qaratilgan. Regressiya, asosan, ikki xususiyat o'rtasidagi munosabatlar yalang'och ko'z bilan aniq bo'lmagan holatlarda qulay bo'ladi.
|
|
|
12
|
Ko‘p o‘zgaruvchili chiziqli regressiya algoritmi.
|
|
|
|
Ko'p o'zgaruvchan regressiya - bu tahlil qilish uchun bir nechta ma'lumotlar o'zgaruvchilarini o'z ichiga olgan boshqariladigan mashinani o'rganish algoritmi. Ko'p o'zgaruvchan regressiya - bu bitta qaram o'zgaruvchi va bir nechta mustaqil o'zgaruvchilar bilan ko'p regressiyaning kengaytmasi. Mustaqil o'zgaruvchilar soniga asoslanib, biz chiqishni taxmin qilishga harakat qilamiz.
Ko'p o'zgaruvchan regressiya o'zgaruvchilar omillari bir vaqtning o'zida boshqalardagi o'zgarishlarga qanday javob berishini tushuntirib beradigan formulani topishga harakat qiladi.
|
|
|
13
|
Ma’lumotlarni vizuallashtirishda scatter plot ta’rifini keltiring
|
|
|
|
Scatter Plots statistik grafiklardagi eng foydali ixtirolardan biri sifatida tavsiflanadi. Dastlab, tarqalish sxemasi ingliz olimi Jon Frederik V. Herschel tomonidan 1833 yilda taqdim etilgan. Gerschel undan qo'sh yulduzlar orbitasini o'rganishda foydalangan. U qo'sh yulduzning pozitsion burchagini o'lchov yiliga nisbatan chizdi. Tarqalish sxemasi ikkita o'lchov o'rtasidagi asosiy munosabatlarni tushunish uchun ishlatilgan. Chiziqli diagrammalar va chiziqli chizmalar tez-tez ishlatilsa ham, tarqalish sxemasi hali ham ilmiy va biznes dunyosida hukmronlik qiladi. Odamlar uchun shkaladagi nuqtalarga qarash va ularning munosabatlarini tushunish juda oson.
|
|
|
14
|
Ma’lumotlarni vizuallashtirishda distplot/histogram plot ta’rifini keltiring
|
|
|
|
Biz ma'lumotlarni gistogramma shaklida ko'rsatish uchun displotdan foydalanamiz (tarqatish uchastkasi deb ham ataladi). Bu to'plangan ma'lumotlarning univariant to'plamidir, ya'ni bir o'zgaruvchining ma'lumotlar taqsimoti boshqa o'zgaruvchiga nisbatan ko'rsatiladi
Histogramma - ma'lumotlar nuqtalari guruhini belgilangan doiraga tashkil etuvchi grafik vakillik. Histogramma yaratish ma'lumotlarni tarqatishning Vizual namoyishini ta'minlaydi. Histogramma yordamida biz katta miqdordagi ma'lumotlarni va uning chastotasini ifodalashimiz mumkin.
|
|
|
15
|
Ma’lumotlarni vizuallashtirishda boxplot ta’fini keltiring
|
|
|
|
|