STATISTICA tahlil vositalari Ma'lumotlar Konchi
Paket keng qamrovli protseduralar va tasvirlash usullarini taklif qiladi.
STATISTICA Data Miner tahlil vositalarini beshta asosiy sinfga ajratish mumkin:
General Slicer/Dicer va Drill-Down Explorer O'zgaruvchilarni bo'lish, guruhlash, tavsiflovchi statistikani hisoblash, tadqiqot grafiklarini yaratish va h.k. imkonini beruvchi protseduralar to'plami.
Umumiy klassifikator - tasniflash. STATISTICA Data Miner tasniflash protseduralarining to'liq to'plamini o'z ichiga oladi: umumlashtirilgan chiziqli modellar, tasniflash daraxtlari, regressiya daraxtlari, klaster tahlillari va boshqalar.
General Modeler/Multivariate Explorer - Umumlashtirilgan chiziqli, chiziqli bo'lmagan va regressiya modellari. Bu element chiziqli, chiziqli bo'lmagan, umumlashtirilgan regressiya modellarini va tasniflash daraxtini tahlil qilish elementlarini o'z ichiga oladi.
Bosh prognozchi - bashorat qilish. ARPSS modellari, mavsumiy ARPSS modellari, eksponensial tekislash, Furye spektral tahlili, mavsumiy parchalanish, neyron tarmoqlarni bashorat qilish va boshqalarni o'z ichiga oladi.
General Neural Networks Explorer - Neyron tarmoq tahlili. Ushbu qism neyron tarmoqlarni tahlil qilish protseduralarining eng to'liq to'plamini o'z ichiga oladi.
Yuqoridagi elementlar boshqa StatSoft mahsulotlari modullarining kombinatsiyasi bo'lib, ularga qo'shimcha ravishda STATISTICA Data Miner Data Mining asboblar qatorini to'ldiradigan maxsus ma'lumotlarni yig'ish protseduralarini o'z ichiga oladi.
Xususiyatlarni tanlash va o'zgaruvchan filtrlash (juda katta ma'lumotlar to'plami uchun) - Maxsus tanlash va ma'lumotlarni filtrlash (katta hajmdagi ma'lumotlar uchun). Ushbu modul keyingi tahlil qilish uchun berilgan ma'lumotlar faylidan avtomatik ravishda o'zgaruvchilarning kichik to'plamlarini tanlaydi. Misol uchun, modul regressiya yoki tasniflash uchun bashorat qiluvchilarni aniqlash uchun millionga yaqin kirish o'zgaruvchilarini qayta ishlashi mumkin.
Assotsiatsiya qoidalari - Uyushma qoidalari. Modul assotsiatsiya qoidalarini aniqlashning apriori algoritmini amalga oshirishdir, masalan, ushbu algoritmning natijasi quyidagicha bo'lishi mumkin: "A" mahsulotini sotib olgandan so'ng, 100 tadan 95 ta holatda, keyingi ikki hafta ichida. shundan so'ng, "B" yoki "C" mahsulotiga buyurtma beradi.
Interaktiv Drill-Down Explorer - Interaktiv chuqur tahlil. Bu katta ma'lumotlar to'plamlarini moslashuvchan tadqiq qilish uchun vositalar to'plami. Birinchi bosqichda siz ma'lumotlarni chuqur tahlil qilish uchun o'zgaruvchilar to'plamini aniqlaysiz; har bir keyingi bosqichda keyingi tahlil qilish uchun kerakli ma'lumotlar kichik guruhini tanlaysiz.
Umumlashtirilgan EM & k-means klaster tahlili - Umumlashtirilgan maksimal o'rtacha va K-means klasteri. Ushbu modul katta ma'lumotlar to'plamlarini qayta ishlash uchun mo'ljallangan va uzluksiz va toifali o'zgaruvchilarni klasterlash imkonini beruvchi klaster tahlil usullarining kengaytmasi bo'lib, naqshni aniqlash uchun barcha zarur funktsiyalarni ta'minlaydi.
Generalized Additive Models (GAM) - Generalized Additive Models (GAM). Hastie va Tibshirani (1990) tomonidan ishlab chiqilgan va ommalashtirilgan usullar to'plami; Ushbu usullarning batafsil muhokamasini Schimek (2000) da topish mumkin.
Umumiy tasnif va regressiya daraxtlari (GTrees) - Umumiy tasnif va regressiya daraxtlari (GTrees). Modul Breiman, Friedman, Olshen va Stone (1984) tomonidan ishlab chiqilgan usullarni to'liq amalga oshirishdir. Bundan tashqari, modulda turli xil yaxshilanishlar va qo'shimchalar mavjud, masalan, katta hajmdagi ma'lumotlar uchun algoritmlarni optimallashtirish va hokazo. Modul umumlashtirilgan tasniflash va regressiya daraxtlari uchun usullar to'plamidir.
Umumiy CHAID (Chi-square Automatic Interaction Detection) modellari - Umumiy CHAID modellari (Chi-square avtomatik shovqinni aniqlash). Oldingi element singari, ushbu modul katta hajmdagi ma'lumotlar uchun ushbu matematik modelni optimallashtirishdir.
data miner statistica regression klasterlash
Interaktiv tasnif va regressiya daraxtlari - Interaktiv tasniflash va regressiya daraxtlari. Har xil turdagi daraxtlarni avtomatik ravishda qurish modullaridan tashqari, STATISTICA Data Miner ham interaktiv tarzda bunday daraxtlarni yaratish vositalarini o'z ichiga oladi.
Boosted Trees - Boosted oddiy daraxtlar. Analitik algoritmlar bo'yicha so'nggi tadqiqotlar shuni ko'rsatadiki, ba'zi "murakkab" hisob-kitoblar, bashoratlar va tasniflar uchun asta-sekin o'sib borayotgan oddiy daraxtlardan foydalanish neyron tarmoqlar yoki murakkab qattiq daraxtlarga qaraganda aniqroq natijalar beradi. Ushbu modul oddiy o'sadigan (kengaytiriladigan) daraxtlarni qurish algoritmini amalga oshiradi.
Multivariate Adaptive Regression Splines (Mar Splines) - Ko'p o'zgaruvchan adaptiv regression splinelar (Mar Splines). Ushbu modul Fridman (1991; Multivariate Adaptive Regression Splines, Annals of Statistics, 19, 1-141) tomonidan taklif qilingan texnikani amalga oshirishga asoslangan; MARSPLINES opsiyalari STATISTICA Data Miner dasturida uzluksiz va toifali bashorat qiluvchilar uchun regressiya va tasniflash muammolarini hal qilish uchun kengaytirilgan.
Hisoblashning yaxshiligi - muvofiqlik mezonlari. Ushbu modul doimiy va toifali o'zgaruvchilar uchun turli xil statistik muvofiqlik testlarini hisoblab chiqadi.
Bashoratli modellarni tezkor joylashtirish - Tez bashorat qilish modellari (ko'p sonli kuzatilgan qiymatlar uchun). Modul qisqa vaqt ichida katta hajmdagi ma'lumotlar uchun tasniflash va bashorat qilish modellarini yaratish imkonini beradi. Olingan natijalar bevosita tashqi ma'lumotlar bazasida saqlanishi mumkin.
Do'stlaringiz bilan baham: |