O‘ZBEKISTON RESPUBLIKASI AXBOROT TEXNOLOGIYALARI VA
KOMMUNIKATSIYALARINI RIVOJLANTIRISH VAZIRLIGI
MUHAMMAD AL-XORAZMIY NOMIDAGI
TOSHKENT AXBOROT TEXNOLOGIYALARI UNIVERSITETI
LABORATORIYA ISHI - 3
Mavzu: Pandas kutubxonasidan foydalanib berilgan ma'lumotlarni tahlil qilish va tozalash, to'ldirish
Guruh: KIF 213-18
Bajardi: Normurodov. M. X
Tekshirdi: Ochilov T.
Toshkent–2021
Laboratoriya ishi-3
Har bir guruhda talabalar jurnal boshidan 5 ta kichik guruhlarga bo’linadi. Agar guruhdagi talabalar sonini 5 ga bo`lib 5 ta guruh hosil qilamiz.
Bajariladigan vazifalar:
Ishdan maqsad
Ma`lumotlarni o`qib olish
O`qib olingan ma`lumotlarni ekranga chiqarish
O’qib olingan ma’lumotlar soni chiqarish df.shape() orqali
Har bir ustun bo’yicha bo’sh qiymatlar yig’indisini chiqarish(misol uchun df.isnull().sum() )
Pandas kutubxonasining dropna() modulidan foydalanib bo’sh qiymatlarni tushirib qoldirish. Agar biror ustundagi ma’lumotlarni 50+(talabaning hemisdagi tartib raqami) % i mavjud bo’lmasa ushbu ustunni tushirib qoldirish. (pandas.drop() dan foydalanib). Qatorning 10+(talabaning tartib raqami)% dan ko’p qismi mavjud bo’lmasa qatorni tushirib qoldirish
Ustunlardagi kategoriyali ma’lumotlarni(misol uchun jinsi ayol yoki erkak bo’lishi mumkin) ushbu ustundagi eng ko’p takrorlangan qiymat(mode) bilan to’ldirish. Boshqa qiymatlarni esa ushbu vaziyatga qarab ustundagi qiymatlarning mean yoki medianlari bilan to’ldirish
Qayta ishlangan ma’lumotlar soni chiqarish df.shape() orqali
1-rasm. Ma`lumotlarni o`qib olish va ularni ekranga chiqarish
print(df.shape) print(df.isnull().sum())
2-rasm. O’qib olingan ma’lumotlar soni df.shape() orqali chiqarish. Har bir ustun bo’yicha bo’sh qiymatlar yig’indisini chiqarish(misol uchun df.isnull().sum() )
3-rasm. Pandas kutubxonasining dropna() modulidan foydalanib bo’sh qiymatlarni tushirib qoldirish. Agar biror ustundagi ma’lumotlarni 50+(talabaning hemisdagi tartib raqami) % i mavjud bo’lmasa ushbu ustunni tushirib qoldirish. (pandas.drop() dan foydalanib). Qatorning 10+(talabaning tartib raqami)% dan ko’p qismi mavjud bo’lmasa qatorni tushirib qoldirish.
4-rasm. Ustunlardagi kategoriyali ma’lumotlarni(misol uchun jinsi ayol yoki erkak bo’lishi mumkin) ushbu ustundagi eng ko’p takrorlangan qiymat(mode) bilan to’ldirish. Boshqa qiymatlarni esa ushbu vaziyatga qarab ustundagi qiymatlarning mean yoki medianlari bilan to’ldirish
df.shape
5-rasm. Qayta ishlangan ma’lumotlar soni chiqarish df.shape() orqali
Do'stlaringiz bilan baham: |