O’ZBEKISTON RESPUBLIKASI AXBOROT TEXNOLOGIYALARI VA KOMMUNIKATSIYALARINI RIVOJLANTIRISH VAZIRLIGI
MUHAMMAD AL-XORAZMIY NOMIDAGI TOSHKENT AXBOROT TEXNOLOGIYALARI UNIVERSITETI
Ma’lumotlar intelektual tahlili -Fan nomi
Laboratoriya ishi-1
Guruh:210-18
Bajardi:Qurbonboyev.X
Tekshirdi: Ochilov T
TOSHKENT-2021
Laboratoriya-1
Har bir guruhda talabalar jurnal boshidan 3 ta kichik guruhlarga bo’linadi. Agar guruhdagi talabalar sonini 3 ga bo`lib 3 ta guruh hosil qilamiz. Birinchi guruh Salary_data.csv faylini oladi. Ikkinchi guruh housing_data.txt faylini oladi. Uchinchi guruh brain_body.txt faylini oladi.
Ma`lumotlarni o`qib olish
O`qib olingan ma`lumotlarni ekranga chiqarish
Ularni scatter plot orqali visuallashtirish
StatsModels kutubxonasidan foydalanib ushbu ma`lumotlar uchun statistikalarni ekranga chiqarish
StatsModels kutubxonasidan foydalangan holda berilgan dataset orqali chiziqli regressiya(linear regression) quring.
Berilgan ma’lumotlarni umumlashtiruvchi chiziqni(Best fit line ) toping
Ushbu chiziqning matematik ko’rinishini yozing(Misol uchun y=x*0.0017+0.2750)
Ishni bajarish:
2 – guruh: housing_data.csv
Ma’lumotlarni o’qib olish:
Dastlab kerakli kutubxona va modullarni import qilamiz:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
import seaborn as sns
sns.set()
Salary_data.csv fayldan ma’lumotlarni o’qib olamiz:
data = pd.read_csv('housing_data.csv')
o’qilgan malumotlarni ekranga chiqarish:
data = data.dropna()
data
d ata.describe()
Ularni scatter plot orqali visuallashtirish
y = data ['price']
x1 = data ['size']
plt.scatter(x1,y)
plt.xlabel('size', fontsize = 20)
plt.ylabel('price', fontsize = 20)
p lt.show()
StatsModels kutubxonasidan foydalanib ushbu ma`lumotlar uchun statistikalarni ekranga chiqarish
x = sm.add_constant(x1)
results = sm.OLS(y,x).fit()
results.summary()
Berilgan ma’lumotlar uchun umumlashgan chiziqni chizish uchun yuqorida belgilangan koeffisentlarni olamiz
StatsModels kutubxonasidan foydalangan holda berilgan dataset orqali chiziqli regressiya(linear regression) quring.
Berilgan ma’lumotlarni umumlashtiruvchi chiziqni(Best fit line ) toping
Ushbu chiziqning matematik ko’rinishini yozing(Misol uchun y=x*0.0017+0.2750)
Berilgan ma’lumotlar uchun umumlashgan chiziqni chizish uchun yuqorida belgilangan koeffisentlarni olamiz
plt.scatter(x1,y)
yhat =95.0282*x1 + 8.312e+04
fig = plt.plot(x1,yhat, lw=4, c='orange', label ='regression line')
plt.xlabel('size', fontsize = 20)
plt.ylabel('price', fontsize = 20)
plt.show()
plt.scatter(x1,y)
yhat =95.0282*x1 + 0
fig = plt.plot(x1,yhat, lw=4, c='green', label ='regression line')
plt.xlabel('size', fontsize = 20)
plt.ylabel('price', fontsize = 20)
plt.xlim(0)
plt.ylim(0)
plt.show()
plt.scatter(x1,y)
yhat =0*x1 + 8.312e+04
fig = plt.plot(x1,yhat, lw=4, c='red', label ='regression line')
plt.xlabel('size', fontsize = 20)
plt.ylabel('price', fontsize = 20)
plt.show()
Do'stlaringiz bilan baham: |