Modelni o’qitish uchun o’quv tanlanma (dataset) qanday turlarga bo’lindi?
o’qituvchi to’plam, o’quv tanlanma (training set);
validatsiya to’plami (validation set);
testlash to’plami (testing set).
O’qitish uchun ma’lumotlar orasidan ortiqcha yoki ahamiyati past bo’lgan, model turg’unligiga ta’sir qiluvchi ma’lumotlarni olib tashlash jarayoni nima deb ataladi
Ma’lumotlarni tozalash (Data Cleaning)
O’qitish uchun o’qitiluvchi to’plamdagi ma’lumotlar turi va toifasini moslashtirish nima uchun kerak
Formatlash ma’lumotlarni bir xil formatga va bir xil o’lchamga keltirib olish uchun
O’qituvchisiz (unsupervised) o’qitish algortimlari to’g’ri ko’rsatilgan javobni ko’rsating
Klasterlash (Hierarchical clustering, ◦ K-means clustering, ◦ K-NN (k nearest neighbors), ◦ Principal Component Analysis, ◦ Singular Value Decomposition, ◦ Independent Component Analysis)
Do'stlaringiz bilan baham: |