O'rash va filtrlash usullariga bo'linishi mumkin bo'lgan xususiyatlarni tanlash uchun ishlatiladigan mexanizmni ko'rib chiqishning yana bir usuli . Ushbu usullar deyarli har doim nazorat qilinadi va ma'lumotlar to'plamida olingan modelning ishlashi asosida baholanadi.
O'rash xususiyatini tanlash usullari turli xil kiritish funksiyalari to'plamiga ega bo'lgan ko'plab modellarni yaratadi va ishlash ko'rsatkichi bo'yicha eng yaxshi ishlashga olib keladigan modelni tanlaydi. Ushbu usullar o'zgaruvchan turlari bilan bog'liq emas, lekin ular hisoblash qimmat bo'lishi mumkin. RFE o'rash xususiyatini tanlash usulining yaxshi namunasidir.
O'rash usullari model ishlashini maksimal darajada oshiradigan optimal kombinatsiyani topish uchun bashorat qiluvchilarni qo'shadigan va/yoki olib tashlaydigan protseduralar yordamida bir nechta modellarni baholaydi.
Filtr xususiyatini tanlash usullari har bir kirish o'zgaruvchisi va maqsadli o'zgaruvchi o'rtasidagi munosabatni baholash uchun statistik usullardan foydalanadi va bu ballar modelda qo'llaniladigan kirish o'zgaruvchilarini tanlash (filtrlash) uchun asos sifatida ishlatiladi.
Filtrlash usullari bashorat qiluvchi modellardan tashqarida bashorat qiluvchilarning dolzarbligini baholaydi va keyinchalik faqat ba'zi bir mezondan o'tgan bashorat qiluvchilarni modellashtiradi.
Va nihoyat, modelni o'rganishning bir qismi sifatida avtomatik ravishda xususiyatlarni tanlashni amalga oshiradigan ba'zi mashina o'rganish algoritmlari mavjud. Biz ushbu usullarni ichki xususiyatlarni tanlash usullari deb atashimiz mumkin .
… ba'zi modellarda o'rnatilgan funksiyalar tanlovi mavjud, ya'ni model faqat aniqlikni maksimal darajada oshirishga yordam beruvchi bashorat qiluvchilarni o'z ichiga oladi. Bunday hollarda model ma'lumotlarning qaysi ko'rinishini tanlashi va tanlashi mumkin
Bunga Lasso kabi jazolangan regressiya modellari va qaror daraxtlari, shu jumladan tasodifiy o'rmon kabi qaror daraxtlari ansambllari kabi algoritmlar kiradi.
Ba'zi modellar tabiiy ravishda informatsion bo'lmagan bashoratchilarga chidamli. Daraxt va qoidalarga asoslangan modellar, MARS va lasso, masalan, o'ziga xos xususiyatlarni tanlashni amalga oshiradi. Xususiyatlarni tanlash, shuningdek, o'lchovlarni qisqartirish texnikasi bilan bog'liq , chunki ikkala usul ham bashoratli modelga kamroq kirish o'zgaruvchilarini qidiradi. Farqi shundaki, xususiyatni tanlash ma'lumotlar to'plamidan saqlash yoki olib tashlash uchun xususiyatlarni tanlaydi, o'lchamlarni kamaytirish esa ma'lumotlarning proektsiyasini yaratadi va natijada mutlaqo yangi kirish xususiyatlari paydo bo'ladi. Shunday qilib, o'lchamlarni qisqartirish xususiyat tanlash turiga emas, balki xususiyat tanlashga alternativadir.
Xususiyatlarni tanlashni quyidagicha umumlashtirishimiz mumkin.