Klasterlash algoritmlari nima?



Download 1,07 Mb.
bet10/17
Sana22.07.2022
Hajmi1,07 Mb.
#839658
1   ...   6   7   8   9   10   11   12   13   ...   17
Bog'liq
klaster

import numpy as np
import pandas as pd
import matplotlib.pyplot as plot
import seaborn as sns
import plotly.express sifatida pxp import plotly.graph_objs sifatida pxp
import plotly.graph_objs as gph
sklearn import metrics
from sklearn.metrics import silhouette_score
from sklearn.cluster import KMeans

ma'lumotlar = pd.read_csv ( 'Customers.csv' )


data.head()

Klasterlash jarayonida talab qilinmaydigan ustunlarni tashlab boshlaylik.
Ma'lumotlar talab qilinmaydigan # ustunlar
tushiriladi.drop( 'CustomerID' , axis= 1 , inplace= True )
Ma'lumotlarning turli ustunlarda qanday taqsimlanishini ko'rish uchun ma'lumotlardagi ustunlar taqsimotini tekshirishimiz mumkin.
plot.figure(figsize = ( 22 , 10 ))
plotnum = 1

[ 'Age' , 'Annual Income' , 'SpendingScore' ] dagi ko'rsatkichlar uchun:


agar plotnum < = 3 bo'lsa :
axs = plot.subplot( 1 , 3 , plotnum)
sns.distplot (ma'lumotlar [cols])
plotnum += 1
plot.tight_layout()
plot.show()

Keling, mijozlarning ma'lum yosh guruhlari bo'yicha taqsimlanishini tekshirish uchun bar syujetini yarataylik. Shuningdek, siz mijozlar sonini va ularning yillik daromadidan kelib chiqqan holda, harajat ballari va mijozlar sonini tasavvur qilish uchun ham xuddi shunday qo'llashingiz mumkin.
age_55yuqorida = data.Age[ma'lumotlar.Age >= 55 ]
age_46_55 = maʼlumotlar.Yosh[(maʼlumotlar.Yosh >= 46 ) & (maʼlumotlar.Yosh <= 55 )]
age_36_45 = maʼlumotlar.Yosh[(maʼlumotlar.Yosh >= 36 ) & (maʼlumotlar.Yosh <= 45 )]
age_26_35 = maʼlumotlar.Yosh[(maʼlumotlar.Yosh >= 26 ) & (maʼlumotlar.Yosh <= 35 )]
age_18_25 = maʼlumotlar.Yosh[(maʼlumotlar.Yosh >= 18 ) & (maʼlumotlar.Yosh <= 25 )]
x_age_ax = [ '18-25' , '26 -35' , '36-45' , '46-55' , '55+' ]
y_age_ax = [len(yosh_18_25.qiymatlar), len(yosh_26_35.qiymatlar), len(yosh_36_45.qiymatlar), len(yosh_46_55.values),
len(age_55yuqorida.values)]

pxp.bar(ma'lumotlar_freym = ma'lumotlar, x = x_age_ax, y = y_age_ax, rang = x_age_ax,


title = 'Bir yosh guruhidagi mijozlar soni' )
Natija: ma'lum bir yosh guruhidagi mijozlarning taqsimlanishini ko'rsatadigan bar syujeti
Klasterlashning eng muhim jihatlaridan biri K ning to'g'ri qiymatini tanlashdir. K ni tasodifiy tanlash qulay tanlov bo'lmasligi mumkin. K qiymatini tanlash uchun tirsak usuli va siluet ballidan foydalanamiz.
Bizning holatda, quyidagi grafikdan K ning tirsak usulida topilgan optimal qiymati 4 ga o'xshaydi. Biz klasterlar sonini maksimal darajada oshirishni va har bir ma'lumot nuqtasi uning klaster markaziga aylanadigan holatlarni cheklashni xohlaymiz.
x_input = data.loc[:, [ 'Yosh' , 'SpendingScore' ]].values
wcss = []
( 1 , 12 ) diapazonidagi k uchun :
k_means = KMeans(n_clusters=k, init= 'k-means++' )
k_means.fit(x_input)
wcss.append(k_means.inertia_)
plot.figure(figsize=( 15 , 8 ))

plot.plot(diapazon( 1 , 12 ), wcss, chiziq kengligi= 2 , marker= '8' )


plot.title( 'Tirsak usuli\n' , fontsize= 18 )
plot.xlabel ( 'K' )
plot.ylabel ( 'WCSS' )
plot.show()

Keling, ushbu maxsus dastur uchun Silhouette koeffitsienti qanday ko'rinishini tekshiramiz.
sklearn.metrics import silhouette_score _
label = k_means.predict(x_input)
# Siluet ballini hisoblash
(f ' Siluet balli(n=4): {siluet_skori(x_input,
label)}' )

Age versus SpendingScorening quyidagi syujetidan ba'zi klasterlar yaxshi ajratilmaganligini ko'rishingiz mumkin. Klasterlar orasidagi klaster ichidagi masofa deyarli ahamiyatsiz va shuning uchun n=4 uchun SC 0,40 ga teng, bu kamroq. Klasterlarning optimal sonini topish uchun K ning turli qiymatlarini sinab ko'ring.
k_means=KMeans(n_clusters= 4 )
labels=k_means.fit_predict(x_input)
chop etish (k_means.cluster_centers_)

Endi ma’lumotlardan klasterlar qanday tuzilganligini tekshirish uchun grafik chizamiz.
plot.figure(figsize = ( 16 , 10 ))
plot.scatter(x_input[:, 0 ], x_input[:, 1 ], c =
k_means.labels_, s = 105 )
plot.scatter(k_means.cluster_centers_[:, 0 ],k_means.cluster_centers_[:, 1 ], rang = "qizil" , s = 250 )
plot.title( 'Mijozlar klasterlari\n' , shrift hajmi = 20 )
plot.xlabel ( 'Yosh' )
plot.ylabel ( 'Xarajat balli' )
plot.show()
Qizil nuqtalar klaster markazlarini ko'rsatadi.
K-Means yordamida Yoshga nisbatan SpendingScore bo'yicha klasterlar tuzilgan
Ma'lumotlar to'rt xil klasterni tashkil qiladi. Moviy klaster kattaroq xarajat baliga ega yosh mijozlarni, binafsha rangli klaster esa xarajat ballari pastroq bo‘lgan keksa mijozlarni ifodalaydi.
“Yosh” va “Yillik daromad” va “SpendingScore” va “Yillik daromad” klasteri uchun yuqorida amalga oshirilgan shunga o'xshash qadamlar qo'llanilishi mumkin. Uchalasini ham Jupyter daftarida topish mumkin bo'lgan 3D syujet yordamida birlashtirish va chizish mumkin . Shuningdek, u bir xil ma'lumotlarda amalga oshirilgan turli xil klasterlash algoritmlariga ega.
2. Rasmni siqish
Rasmni siqish - tasvir sifatini yomonlashtirmasdan tasvirlarga qo'llaniladigan siqish texnikasining bir turi. Tasvir hajmining kamayishi ularni cheklangan hajmdagi disk maydonida saqlashga yordam beradi.
Tasvirni siqish texnikasi nima uchun kerak? Tasvirni siqish uchun turli xil ehtiyojlar mavjud. Tibbiy tasvirlar arxivlanishi kerak bo'lgan va ma'lumotlar hajmi juda katta bo'lgan sog'liqni saqlashda siqish juda muhimdir. 
O'rnatish sifatida taqdim etilgan tasvirning eng foydali komponentlarini ajratib olish va saqlash kerak bo'lganda, tasvirni siqish ko'proq ma'lumotlarni saqlash uchun juda foydali yondashuv bo'lishi mumkin.
Tasvirni siqishning ikki turi mavjud:


  1. Download 1,07 Mb.

    Do'stlaringiz bilan baham:
1   ...   6   7   8   9   10   11   12   13   ...   17




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish