4-MAVZU: BIR VA KUP UZGARUVCHILI CHIZIQLI REGRESSIYA BILAN ISHLASH
Reja:
2) Daraxtlar kurinishida chiqdik regressiya.
2) Daraxtlar kurinishida chiqdik regressiya.
Biz qaror daraxtlari bilan ishlashni ko'rib chiqdik regressiyani ko'rib chiqishga o'tamiz. Keling, chiziqli modellardan boshlaymiz, misol sifatida darajani bashorat qilish muammosining echimi bo'sh ish o'rinlari bo'yicha ish haqi.
Chiziqli usullar siyrak bilan yaxshi ishlaydi ma'lumotlar. Bularga, masalan, matnlar kiradi. Buni yuqori o'quv stavkasi va oz sonli parametrlar bilan izohlash mumkin, shu bilan ortiqcha moslashishdan saqlanish. Chiziqli regressiya bog'liq ravishda bir nechta navlarga ega qaysi regulyatordan foydalanilganiga qarab.
biz bajaradigan vazifa kvadratik yoki L2 ga teng sinfda sklearn.linear_model. Ridge tizma regressiyasi mumkin Dastlabki ma'lumotlar "Salary_train.csv", test ma'lumotlari "Salary_test_mini.csv" shaklda ko'rsatilgan shaklga ega.
Bunday holda, ustunlar A belgilar va oxirgi ustun Ko'rib turganingizdek, birinchi ustunda katta matn mavjud, yuklash uchun oldindan ishlov berish kerak Masalan, TF ni chiqarib oling sklearn.feature_extraction.text.TfidfVectorizer TF o'z ichiga olgan matritsaga matnli qator 192 Chiziqli regressiya bog'liq ravishda bir nechta navlarga ega qaysi regulyatordan foydalanilganiga qarab. Doirasida biz tog 'regressidan foydalanamiz kvadratik yoki L2-regulyator o'zgargan. Ushbu model sklearn.linear_model.Ridge sinfida. Amalga oshirish haqida ko'proq bilib oling Regressiyalarni bu erda o'qishingiz mumkin.
60000 ta yozuvning dastlabki ma'lumotlari faylda saqlanadi , test ma'lumotlari (2 ta yozuv) faylda saqlanadi "(Siz ularni bu yerdan yuklab olishingiz mumkin bu 1-rasmda keltirilgan.
Bunday holda, A-C ustunlari kirish qiymatlarini o'z ichiga oladi xususiyatlari va oxirgi ustun maqsad o'zgaruvchisi.
1-Rasm. Dastlabki ma'lumotlar.
Ko'rib turganingizdek, birinchi ustunda katta matn mavjud, bu modelga yuklanishi uchun oldindan ishlov berish kerak. Sinf yordamida TF-IDF-belgilar o'zgartiradigan extraction.text. TfidfVectorizer TF-IDF atributlarini o'z ichiga olgan matritsaga matnli qator. Ko'proq Chiziqli regressiya ushbu model amalga oshiriladigan jumla-regressiyaga qarab bir nechta navlarga ega Amalga oshirish haqida ko'proq bilib oling faylda saqlanadi faylda saqlanadi.
Do'stlaringiz bilan baham: |