# subplotlar bo'ylab aylanish va i uchun centroid tasvirlarni qo'shing , enumerate(axs.flat) ichida ax :
# kalit uchun cluster_labels lug'atidan foydalanib taxmin qilingan yorliqni aniqlang , cluster_labels.items()
dagi qiymat: agar i qiymatda bo'lsa :
ax.set_title( 'Tahmin qilingan yorliq: {}' .format(kalit))
# subplotga rasm qo'shing ax.matshow(rasmlar[i])
ax.axis( 'off' )
# fig.show() rasmini ko'rsatish
Ushbu grafiklar klaster uchun eng vakili tasvirni aks ettiradi.
Natija: Har bir klaster uchun eng ko'p ifodalangan rasm Klasterlar soni va ma'lumotlar punktlari soni ortib borishi bilan hisoblash vaqtida nisbatan tejamkorlik oshadi. Vaqtni tejash faqat klasterlar soni juda ko'p bo'lganda sezilarli bo'ladi. Partiya hajmining hisoblash vaqtidagi ta'siri faqat klasterlar soni ko'proq bo'lganda sezilarli bo'ladi.
Klasterlar sonining ko'payishi Mini-Batch K-Means yechimining K-Means yechimiga o'xshashligini pasaytiradi. Klasterlar soni ortishi bilan bo'limlar o'rtasidagi kelishuv kamayadi. Bu shuni anglatadiki, oxirgi qismlar boshqacha, ammo sifat jihatidan yaqinroq.
Klaster ko'rsatkichlari
Klasterlash algoritmingiz tomonidan olingan klasterlarning qanchalik yaxshi ekanligini tekshirish uchun ba'zi baholash ko'rsatkichlari mavjud.
Bir hillik reytingi
Bir hillik ko'rsatkichi : Klasterlash natijalari bir xillikni qondiradi, agar uning barcha klasterlarida faqat bitta sinf a'zolari bo'lgan ma'lumotlar nuqtalari mavjud bo'lsa. Ushbu ko'rsatkich teglarning mutlaq qiymatiga bog'liq emas. U quyidagicha aniqlanadi:
Bir hillik balli 0 va 1 oralig'ida chegaralangan. Past qiymat past bir hillikni, 1 esa mukammal bir hil yorliqlashni bildiradi.
Ypred bilimi Ytrue ning noaniqligini pasaytirganda, kichikroq bo'ladi (h → 1) va aksincha.
Zo'r etiketkalar bir hil. Sinflarni ko'proq klasterlarga ajratadigan mukammal bo'lmagan yorliqlar bir hil bo'lishi mumkin. Klasterdagi turli sinflardan olingan namunalar bir hil etiketkani qoniqtirmaydi.
To'liqlik balli
Klasterlash natijalari faqat ma'lum sinfning ma'lumotlar nuqtalari bir xil klasterning bir qismi bo'lsa, to'liqlikni qondiradi.
Bu koʻrsatkich nosimmetrik emas, shuning uchun yuqoridagi tenglamadan label_true va label_pred ni almashtirish turli xil boʻlgan bir xillik ballini qaytaradi. Xuddi shu narsa bir xillik balliga ham tegishli; label_true va label_predni almashtirish to'liqlik ballini qaytaradi.
Mukammal yorliqlar tugallandi. Barcha sinf a'zolarini bir xil klasterlarga tayinlaydigan mukammal bo'lmagan yorliqlar hali ham to'liq. Agar sinf a'zolari turli klasterlarga bo'lingan bo'lsa, topshiriq bajarilmaydi.
V o'lchov ball
V-o'lchovli klaster yorlig'i asosiy haqiqatni beradi. V o'lchov bir xillik va to'liqlik o'rtasidagi garmonik o'rtacha hisoblanadi.
Ushbu ko'rsatkich simmetrikdir. “label_true” ni “label_pred” bilan almashtirish bir xil qiymatni qaytaradi. Haqiqiy asos haqiqati noma'lum bo'lsa, bu ko'rsatkich bir xil ma'lumotlar to'plamida ikkita mustaqil yorliq belgilash texnikasining qabul qilinishini hisoblash uchun foydali bo'lishi mumkin.
Hisob 0-1 oralig'ida. 1 mukammal to'liq yorliqlashni anglatadi.
Misol:
sklearn