Boksplot (Quti diagramma) –raqamli maʼlumotlarning joylashuvi, tarqalishi va egrilik guruhlarini ularning kvartillari orqali grafik koʻrsatish usuli hisoblanadi. Quti hududidagi qutiga qoʻshimcha ravishda, qutidan yuqori va pastki kvartillardan tashqaridagi oʻzgaruvchanlikni koʻrsatadigan chiziqlar (ular bakenbarda deb ataladi) boʻlishi mumkin, shuning uchun uchastka quti va bakenbardali uchastka deb ham ataladi. Maʼlumotlar toʻplamining qolgan qismidan sezilarli darajada farq qiluvchi chegaralar qutidagi bakenbardadan tashqari alohida nuqtalar sifatida chizilishi mumkin. Qutidagi chizmalar parametrik emas: ular asosiy statistik taqsimot haqida hech qanday taxminlarsiz statistik populyatsiya namunalarida oʻzgaruvchanlikni koʻrsatadi. Quti diagrammaning har bir kichik boʻlimidagi intervallar maʼlumotlarning tarqalishi (tarqalishi) va egrilik darajasini koʻrsatadi, ular odatda besh raqamli xulosa yordamida tavsiflanadi. Bunga qoʻshimcha ravishda, quti syujeti turli L-baholovchilarni, xususan, kvartillar oraligʻi, oʻrta diapazon, diapazon, oʻrta diapazon va trimeanni vizual ravishda baholashga imkon beradi. Qutili diagrammagorizontal yoki vertikal ravishda chizilgan boʻlishi mumkin.
Tarixi
Diapazon-bar usuli birinchi marta Mary Eleanor Spear tomonidan 1952-yilda "Charting Statistics" kitobida va yana 1969-yilda "Amaliy grafik uslublari" kitobida ishlatilgan. Box-and-whisker chizmasi birinchi marta 1970-yilda John Tukey tomonidan kiritilgan bo'lib, u keyinchalik 1977-yilda "Exploratory Data Analysis“ (Tadqiqot ma'lumotlari tahlil qilish) kitobida nashr etilgan.
Elementlari
Quti diagramma - bu besh raqamli xulosaga asoslangan ma'lumotlar to'plamini ko'rsatishning standartlashtirilgan usuli: minimal, maksimal, namunaviy mediana va birinchi va uchinchi kvartillar.
Minimal (Q0 yoki 0 foizli): maʼlumotlar toʻplamidagi eng past maʼlumotlar nuqtasi, har qanday chegaradan tashqari.
Maksimal (Q4 yoki 100 foizli): ma'lumotlar to'plamidagi eng yuqori ma'lumotlar nuqtasi, har qanday o'zgaruvchanlikdan tashqari.
Median (Q2 yoki 50-persentil): ma'lumotlar to'plamidagi o'rta qiymat.
Birinchi kvartil (Q1 yoki 25 foizli): pastki kvartil qn (0,25) sifatida ham tanilgan, bu maʼlumotlar toʻplamining pastki yarmining medianasidir.
Birinchi kvartil (Q1 yoki 25 foizli): pastki kvartil qn (0,25) sifatida ham tanilgan, bu maʼlumotlar toʻplamining pastki yarmining medianasidir.
Uchinchi kvartil (Q3 yoki 75 foizli): yuqori kvartil qn(0,75) sifatida ham tanilgan, bu ma’lumotlar toʻplamining yuqori yarmining medianasidir.
Quti uchastkasini qurish uchun foydalaniladigan minimal va maksimal qiymatlarga qo'shimcha ravishda, quti uchastkasini olish uchun ishlatilishi mumkin bo'lgan yana bir muhim element quyida ko'rsatilganidek, kvartillararo diapazondir (IQR):
Kvartillararo diapazon (IQR) : yuqori va pastki kvartillar orasidagi masofa:
Minimaldan maksimalgacha
1,5 IQR qiymatida chizilgan mo'ylovli bir xil
quti diagramma
Variatsiyalar
Matematik Jon V. Tukey birinchi marta 1969 yilda vizual ma'lumotlarni ko'rsatishning ushbu turini ommalashtirganidan beri, klassik quti syujetida bir nechta variatsiyalar ishlab chiqilgan va eng ko'p topilgan ikkita variant - o'zgaruvchan kenglikdagi quti diagrammalar (variable width box plots) va tishli quti diagrammalar (notched box plots).
To'rtta quti uchastkasi, tishli va tishli bo'lmagan va o'zgaruvchan kenglik
O'zgaruvchan kenglikdagi qutilar diagrammasi (Variable width box plots) ma'lumotlari chizilgan har bir guruhning o'lchamini, qutining kengligini guruh o'lchamiga mutanosib qilib ko'rsatadi. Ommabop konventsiya qutining kengligini guruh o'lchamining kvadrat ildiziga proportsional qilishdir.
O'zgaruvchan kenglikdagi qutilar diagrammasi (Variable width box plots) ma'lumotlari chizilgan har bir guruhning o'lchamini, qutining kengligini guruh o'lchamiga mutanosib qilib ko'rsatadi. Ommabop konventsiya qutining kengligini guruh o'lchamining kvadrat ildiziga proportsional qilishdir.
Tishli quti uchastkalari mediana atrofida toraytirishni kuzatiladi. Teshiklar medianlar farqining ahamiyati haqida taxminiy ko'rsatma berishda foydalidir; agar ikkita qutining tirqishlari bir-biriga to'g'ri kelmasa, bu medianalar o'rtasidagi statistik jihatdan muhim farqni tasdiqlaydi. Teshiklarning kengligi namunaning kvartillararo diapazoni (IQR) bilan proportsionaldir va namuna o'lchamining kvadrat ildiziga teskari proportsionaldir.
Vizualizatsiya
Garchi quti diagrammalari gistogramma yoki yadro zichligi taxminlaridan ko'ra ibtidoiy ko'rinishi mumkin bo'lsa-da, ular bir qator afzalliklarga ega. Birinchidan, quti diagrammasi statistiklarga bir yoki bir nechta ma'lumotlar to'plamida tezkor grafik tekshiruv o'tkazish imkonini beradi.
Qutidagi chizmalar ham kamroq joy egallaydi va shuning uchun bir nechta guruhlar yoki ma'lumotlar to'plami o'rtasidagi taqsimotlarni parallel ravishda solishtirish uchun ayniqsa foydalidir.
Nihoyat, gistogrammalarning umumiy tuzilishi va yadro zichligi bahosi mos ravishda qutilarning soni va kengligi texnikasini tanlash va tarmoqli kengligi tanlash bilan kuchli ta'sir qilishi mumkin.
Statistik taqsimotni ko'rib chiqish quti grafigiga qaraganda keng tarqalgan bo'lsa-da, normal N(0,s2) taqsimot uchun quti grafigini ehtimollik zichligi funksiyasi (nazariy gistogramma) bilan solishtirish va ularning xususiyatlarini bevosita kuzatish foydali bo'lishi mumkin.
Ma'lumotlar to'plamining qiyshiqligini aks ettiruvchi quti diagrammalar