Faktor tahlili- kovariatsiya yoki korrelyatsiya matritsalarining tuzilishini o'rganish orqali kuzatilgan o'zgaruvchilar to'plamining o'lchamini baholash usullarini birlashtirgan ko'p o'zgaruvchan statistik tahlil bo'limi. Boshqacha qilib aytganda, usulning vazifasi - kuzatilgan o'zgaruvchanlikni aniqlaydigan haqiqiy ko'p sonli belgilar yoki sabablardan ma'lumotni minimal yo'qotish bilan eng muhim o'zgaruvchilarning (omillarning) kichik soniga o'tishdir. Usul dastlab psixologiya va antropologiya muammolarida (19-20-asrlar oxirida) paydo bo'lgan va ishlab chiqilgan, ammo hozir uni qo'llash doirasi ancha kengroq.
2 savol Bazis – radial funktsiyalari aktivatsiyasi
|
RBF - radial asosli funktsiya - radial asos funktsiyasi sifatida tarjima qilinadi. Bunday tarmoqlar bizga funksiyalarni yaqinlashtirishdan foydalanishning keyingi bosqichiga o'tish imkonini beradi. Radial asosli funktsiyalar tarmoqlari ikki shaklda ifodalanishi mumkin. Birinchisi, radial asosli funktsiyalar tarmog'i aslida chiziqli model bo'lib, unda biz birinchi bo'lib xususiyatlarni ajratib oldik va xususiyatlar radial asos funktsiyalarining yadrosiga aylandi. Tez orada radial asosli funktsiyalarning yadrolari nima ekanligini muhokama qilamiz. Radial asosli funktsiyalar tarmog'ini ifodalashning ikkinchi usuli - bu bitta yashirin qatlamli neyron tarmoq va faollashtirish funktsiyasi sifatida radial asos funktsiyalari.
Yodda tutingki, biz neyron tarmoqlarni birinchi marta muhokama qila boshlaganimizda, biz ularga teskari tartibda qaragan edik. Dastlab biz neyron tarmoqni funktsiyalarning katta chiziqli bo'lmagan yaqinlashuvi sifatida ko'rib chiqdik, ammo keyin biz yashirin tugunlarni ko'rishning bir usuli - ular avtomatik ravishda kiritilgan ma'lumotlarning xususiyatlarini ko'rsatishni o'rganish ekanligini bilib oldik.
|
3 savol DM modellari, usullari va standartlari. Qaror qabul qilishda DM usullarini qo'llash.
|
Ma'lumotni qazib olish modeli ma'lumotlarni qazib olish tuzilmasidan ma'lumotlarni oladi va keyin ma'lumotlarni qazib olish algoritmi yordamida ushbu ma'lumotlarni tahlil qiladi. Kon tuzilishi va kon modeli alohida ob'ektlardir. Ma'lumotlarni qidirish strukturasi ma'lumotlar manbasini aniqlaydigan ma'lumotlarni saqlaydi. Ma'lumotni qazib olish modeli ma'lumotlarni statistik qayta ishlash natijasida olingan ma'lumotlarni, masalan, tahlilda topilgan naqshlarni saqlaydi.
Baza tuzilishi tomonidan taqdim etilgan ma'lumotlar qayta ishlangan va tahlil qilinmaguncha kon modeli bo'sh. Qayta ishlangandan so'ng, kon modeli metama'lumotlar, natijalar va kon tuzilishiga bog'lanishlarni o'z ichiga oladi.
Siz quyidagi umumiy bosqichlarni bajarib, ma'lumotlarni qidirish modelini yaratasiz:
Asosiy kon tuzilmasini yarating va kerak bo'lishi mumkin bo'lgan ma'lumotlar ustunlarini kiriting.
Analitik vazifaga eng mos keladigan algoritmni tanlang.
Modelda foydalanish uchun strukturadan ustunlarni tanlang va ulardan qanday foydalanish kerakligini belgilang - qaysi ustunda siz bashorat qilmoqchi bo'lgan natija, qaysi ustunlar faqat kiritish uchun va hokazo.
Majburiy emas, algoritm bo'yicha ishlov berishni nozik sozlash uchun parametrlarni o'rnating.
Struktura va modelni qayta ishlash orqali modelni ma'lumotlar bilan to'ldiring.
|
4 savol Ko'p qatlamli neyron to'rlari. Neyron to'rlarini minimal konfiguratsiyada sintez qilish. Ekspert va neyroekspert tizimlar. Genetik algoritmlar.
|
Ko’p qatlamli neyron tarmoqlari.Ko’p qatlamli neyron tarmoqlar qatlamlar bir-biri bilan ketma-ket bog’lanadi. Ya’ni, birinchi qatlam chiqishida keyingi qatlam va shu kabi davom etadi. Birin ketin qatlamlarni amalga oshirishda paydo bo’lgan xatolarni umumiy yig’indisi ko’rinishda olsak, birini xatosini ikkinchisi to’ldirib ketadi va umumiy xatolar soni nisbatan kamayadi
|
5 savol Fisher chiziqli diskriminanti. Narxga chegara qo'yilgan holat uchun turli alomatlardan informativ alomatlar to'plamini hisoblash.
|
Fisherning chiziqli diskriminant tahlili kuzatilgan yoki o'lchangan o'zgaruvchilarning chiziqli birikmasidir
kuzatishlarning ma'lum guruhlari orasidagi ajralishlarni eng yaxshi tasvirlab berish
|
3 variant 2 savol Neyron to'rlarida masala yechishning turg'unligi.
|
Statistik ma'lumotlarni qayta ishlash nazariyasi va amaliyotining rivojlanishi ikki parallel yo'nalishda davom etdi. Birinchidan
klassik ehtimollik imkoniyatini ta'minlovchi matematik statistika usullarini o'z ichiga oladi
tahlil qilingan ma'lumotlar va olingan statistik xulosalar talqini (ehtimoliy yondashuv). Ikkinchi
yo'nalish ehtimoliy tabiatga asoslangan apriori bo'lmagan statistik usullarni o'z ichiga oladi
qayta ishlangan ma'lumotlar, ya'ni. «matematik statistika» (mantiqiy-algebraik yondashuv) ilmiy fanining doirasidan tashqarida qoladi. Tadqiqotchi faqat yig'ish shartlari mavjud bo'lganda ikkinchi yondashuvga murojaat qilishga majbur bo'ladi
dastlabki ma'lumotlar statistik ansambl doirasiga to'g'ri kelmaydi, ya'ni. amaliy bo'lmagan vaziyatda
yoki hech bo'lmaganda takroriy takror ishlab chiqarishning aqliy aqliy imkoniyati
tahlil qilingan ma'lumotlar o'lchanadigan asosiy shartlar to'plami.
|
2 savol Neyron to'rlarida masala yechishning turg'unligi.
|
ptimallashtirishni hal qilishda
vazifalari, neyron tarmog'ining energiya funktsiyasi qurilgan va uning ekstremal qiymatlari sobit bilan bog'liq.
mahalliy va global minimallarni amalga oshiradigan tarmoq nuqtalari. Ushbu muammoni samarali hal qilish uchun NSH bilan bog'liq bo'lgan sobit nuqtaga nisbatan asimptotik barqaror bo'lishi kerak.
global minimal. Shunday qilib, MTJ barqarorligini tadqiq etish dolzarb vazifa hisoblanadi.. MTJ barqarorligi haqida kechikkan va kechiktirmasdan keng adabiyotlar mavjud [5-
o'n sakkiz]. Bunday holda, asosan, doimiy faollashtirish funktsiyalariga ega NSH ko'rib chiqiladi. Muallifning asarlarida uzluksiz faollashtirish funksiyalariga ega bo‘lgan NKMlar o‘rganilgan Ular assotsiativ sifatida ham qo‘llaniladi.
xotira. Bunday holda, xotira elementi chiziqli bo'lmagan NSH ning har bir barqaror sobit nuqtasi bilan bog'lanadi.
Shunday qilib, asimptotik tarzda iloji boricha ko'proq chiziqli bo'lmagan NSHlarni qurish muammosi paydo bo'ladi
barqaror sobit nuqtalar. NSH asosidagi assotsiativ xotirani o'rganish juda ko'p ishlarning mavzusi, xususan [7,19].
Biroq, hatto sobit nuqtalarning asimptotik barqarorligi va ularning mintaqalarining mavjudligi
jalb qilish, NSHning samarali ishlashi uchun etarli emas. NSHni qurish qiyin emas
tarmoq cheksiz ravishda yaqinlashadigan asimptotik barqaror sobit nuqta bilan. Shu sababli, NSHni sobit nuqtalarga barqarorlashtirish muammosi paydo bo'ladi. Mualliflarning ma'lumotlariga ko'ra, bu muammo haligacha o'rganilmagan.
|
3 savol
Algoritmlar, o'qitish metodi, sifat funktsionali, yo'qotish funktsiyasi. Emperik tahlikani minimallashtirish tamoyillari. Umumlashtiruvchi qobiliyat. Sirg'aluvchi nazorat.
|
Empirik xavf - bu o'quv majmuasidagi algoritm xatosining o'rtacha qiymati.
Riskni empirik minimallashtirish (ERM) - bu ko'plab muammolarni o'rganish muammolarini, birinchi navbatda, nazorat qilinadigan o'quv muammolarini, jumladan tasniflash va regressiya muammolarini hal qilish uchun umumiy yondashuv.
Asosiy afzallik shundaki, bu konstruktiv va universal yondashuv bo'lib, o'quv muammosini raqamli optimallashtirish muammolariga qisqartirishga imkon beradi.
Asosiy kamchilik - xavfni minimallashtirishning empirik usulidan foydalanganda deyarli har doim sodir bo'ladigan haddan tashqari moslashish hodisasi.
Modelning murakkabligini cheklash
Strukturaviy xavfni minimallashtirish usuli
xususiyat tanlash
Model parametrlariga qo'shimcha cheklovlar qo'yish
Muntazamlashtirish
Bayes muntazamligi
|
4 savol Informativ belgi tushunchasi. Mantiqiy korrelyatsiya va turli toifadagi alomatlarning informativlarini ajratish.
|
Matnning axborot boyligi va matnning informativligi tushunchasi.
Vaqt va urg'usiz matn tushunchasi. Tarkib bo'yicha taqdimotning keskinligi -
o'quvchi tomonidan shakl birligida olingan ma'lumotlarning miqdori; atamalarda zamon taqdimoti
ifodalar - axborot birligi uchun shakl birliklari soni. Dozalash
"qadoqlash materiali" (L.V. Shcherba atamasi) matnning muhim ma'lumotlarni o'tkazmaydigan qismlari, lekin
semantik ma'lumotlarni idrok etish qobiliyati cheklangan o'quvchilar uchun zarur.
|
5 savol
Intellekt koeffitsienti va uni hisoblash metodi.
|
Intelligence quotient (ingliz. IQ - intelligence quotient, o'qing "Ai Q") - inson aql-zakovati darajasini miqdoriy baholash (razvedka koeffitsienti): o'rtacha odamning (bir xil yoki o'rta) aql darajasiga nisbatan aql darajasi. yoshi); tor ma'noda, aqliy yosh deb ataladigan shaxsning (shaxsning) haqiqiy xronologik yoshiga nisbati. U maxsus testlar (masalan, Eysenck testi) yordamida aniqlanadi. IQ umumiy intellekt omilini (g) baholashga urinishdir.
IQ testlari shunday tuzilganki, natijalar o'rtacha IQ qiymati m = 100 va standart og'ish s = 15 bo'lgan normal taqsimot bilan tavsiflanadi [1]. Agar IQ taqsimoti shu tarzda aniqlansa, natijalarning taxminan 2⁄3 qismi (aniqrog'i, 68,3%) 85 dan 115 gacha, ya'ni mediananing bitta standart og'ishi doirasida bo'ladi. Natijalarning taxminan 50% IQ = 100 ± 10 chegaralariga to'g'ri keladi. Natijalarning taxminan 4,6% medianadan ikkita standart og'ishdan tashqarida: IQ < 70 bilan 2,3% va IQ > 130 bilan bir xil. IQ qiymati 70 dan kam bo'lsa, ko'pincha aqliy zaiflik bilan tavsiflanadi.
|
6 variant
1 savol) Baholarni hisoblash algoritmi. Fisher chiziqli diskriminanti
|
Chiziqli diskriminant tahlili (LDA), Oddiy diskriminant tahlili (NDA) yoki Diskriminant funktsiyani tahlil qilish - bu Fisherning chiziqli diskriminant tahlilining umumlashtirilishi, statistikada, naqshni aniqlashda va o'quv mashinalarida tavsiflovchi yoki tavsiflovchi xususiyatlarning chiziqli birikmasini topish uchun ishlatiladigan usul. ikki yoki undan ortiq sinf yoki hodisalarni ajratib turadi. Olingan kombinatsiya chiziqli klassifikator sifatida yoki, odatda, tasniflashdan oldin o'lchamlarni kamaytirish uchun ishlatilishi mumkin.
LDA dispersiya tahlili (ANalyse Of Variance=ANOVA) va regressiya tahlili bilan chambarchas bog'liq bo'lib, u bir qaram o'zgaruvchini boshqa xususiyatlar yoki o'lchovlarning chiziqli birikmasi sifatida ifodalashga harakat qiladi[1][2]. Biroq, ANOVA sifatli mustaqil o'zgaruvchilar va uzluksiz[en] bog'liq o'zgaruvchidan foydalanadi, diskriminant tahlili esa uzluksiz mustaqil o'zgaruvchilarga va sifatga bog'liq bo'lgan o'zgaruvchiga ega (ya'ni sinf yorlig'i)[3]. Logistik regressiya va probit regressiyasi dispersiyani tahlil qilishdan ko'ra LDA ga ko'proq o'xshaydi, chunki ular doimiy tushuntirish o'zgaruvchilari nuqtai nazaridan sifatli o'zgaruvchini ham tushuntiradi. Ushbu boshqa usullar mustaqil o'zgaruvchilar normal taqsimlangan deb taxmin qilish uchun hech qanday sabab bo'lmagan ilovalarda afzallik beriladi, bu LDA usulining asosiy taxminidir.
|
6 variant
2 savol) Neyron to'rlariga asoslangan tanib olish usullari va algoritmlari
|
Insonni yuz tasviridan tanib olish biometrik tizimlar orasida alohida ajralib turadi, birinchidan, buning uchun maxsus qimmat uskunalar kerak emas. Ko'pgina ilovalar uchun shaxsiy kompyuter va an'anaviy videokamera etarli. Ikkinchidan, odam va qurilmalar o'rtasida jismoniy aloqa yo'q. Hech narsaga tegmaslik yoki ataylab to'xtash va tizimning ishlashini kutishning hojati yo'q. Aksariyat hollarda oddiygina o'tib ketish yoki kamera oldida bir necha soniya turish kifoya.
Insonni yuz tasviridan tanib olishning kamchiliklari orasida bunday tizim o'z-o'zidan 100% identifikatsiya ishonchliligini ta'minlamaydi. Yuqori ishonchlilik talab qilinadigan hollarda bir nechta biometrik usullarning kombinatsiyasi qo'llaniladi [11].
Hozirgi vaqtda odamni yuz tasviridan tanib olish muammosiga ko'plab asarlar bag'ishlangan, ammo umuman olganda, u haligacha hal qilinmagan. Asosiy qiyinchiliklar - suratga olish paytida burchak va yorug'lik sharoitlarining o'zgarishi, shuningdek, yosh, soch turmagi va boshqalar bilan bog'liq turli xil o'zgarishlardan qat'i nazar, odamni yuz tasviridan tanib olishdir. [11,25,30,58].
|
6 variant
3 savol) Klassifikatsiya qilishning mantiqiy qonuniyatlari. Qonuniyat va informativlik tushunchalari. Mantiqiy qonuniyat tushunchalari. Evristik va statistik qonuniyatlarning qiyosiy taxlili. Qonuniyat turlari: giper shar, giper tekislik, giperparallelepiped (kon'yuktsiya).
|
* Tergov va sud amaliyotida xatolar ko'pincha rasmiy mantiq qonunlarining buzilishi tufayli yuzaga keladi. Bu fikrni to'g'ri qurish va bog'lash qonunlari, ya'ni. to'g'ri fikrlash qonunlari. Rasmiy ravishda mantiqiy qonunlar o'rganilayotgan hodisa ma'lum vaqt davomida statik, "muzlatilgan" holatda ko'rib chiqiladigan hollarda ishlaydi. Formal mantiqning uchta qonuni mavjud:
1) o'ziga xoslik qonuni;
2) qarama-qarshilik qonuni yoki chiqarib tashlangan o'rta qonuni;
3) etarli sabab qonuni.
* Qonuniylik - davlat organlari, mansabdor shaxslar va fuqarolar tomonidan huquqiy normalarga va birinchi navbatda qonunlarga qat'iy rioya qiladigan siyosiy-huquqiy rejim yoki davlatda huquqning real amal qilish prinsipi.
Informativlik (matn nazariyasida) keng ma'noda xabarning butun mazmuni va tor ma'noda matnda mavjud bo'lgan yangi bilim sifatida talqin etiladi.
* Tasniflash masalalaridagi mantiqiy naqsh bu oson talqin qilinadigan qoida (qoida) bo'lib, u o'quv namunasidan bir sinf ob'ektlarining etarlicha ko'p sonini tanlaydi va amalda boshqa sinflar ob'ektlarini tanlamaydi.
* Gipersfera (boshqa yunoncha ὑπĵr- "super-" + schaῖra "to'p" dan) - n o'lchovli Evklid fazosidagi yuqori sirt bo'lib, ma'lum bir nuqtadan teng masofada joylashgan nuqtalar tomonidan hosil bo'lib, sharning markazi deb ataladi.
Giper tekislik - vektor, affin yoki proyektiv fazodagi 1-kod o'lchovning pastki fazosi; ya'ni o'lchami o'rab turgan fazodan bir kichik bo'lgan pastki fazo.
Misol uchun, ikki o'lchovli fazo uchun giper tekislik to'g'ri chiziq (tenglama bilan aks ettirilgan)
n_{1}x_{1}+n_{2}x_{2}=b), uch oʻlchamli uchun — tekislik, toʻrt oʻlchovli uchun — uch oʻlchamli fazo (“uch oʻlchovli tekislik”) va h.k.
|
6 variant
4 savol) Klasterli taxlilda statistik algoritmlar: EM algoritmi va k guruxdagi o'rtacha algoritmi. Algoritm dendrogrammani qurish algoritmlari. k eng yaqin qo'shnining optimal qiymatini hisoblash.
|
* Klasterlash (yoki klaster tahlili) - ob'ektlar to'plamini klasterlar deb ataladigan guruhlarga bo'lish vazifasi. Har bir guruh ichida "o'xshash" ob'ektlar bo'lishi kerak va turli guruhlarning ob'ektlari imkon qadar farq qilishi kerak. Klasterlash va tasniflashning asosiy farqi shundaki, guruhlar ro'yxati aniq belgilanmagan va algoritm jarayonida aniqlanadi.
*Klaster tahlilining ierarxik usullari kichik hajmdagi ma'lumotlar to'plamlari bilan qo'llaniladi.
Ierarxik klasterlash usullarining afzalligi ularning ko'rinishidir.
Ierarxik algoritmlar ierarxik klaster tahlilining natijasi bo'lgan dendrogrammalar (yunoncha dendron - "daraxt" dan) qurilishi bilan bog'liq. Dendrogramma alohida nuqtalar va klasterlarning bir-biriga yaqinligini tavsiflaydi va klasterlarni birlashtirish (ajralish) ketma-ketligini grafik jihatdan ifodalaydi.
Dendrogramma (dendrogramma) - n ta darajani o'z ichiga olgan daraxt diagrammasi, ularning har biri klasterlarni ketma-ket kattalashtirish jarayonidagi bosqichlardan biriga to'g'ri keladi.
Dendrogramma daraxt diagrammasi, klaster birlashma daraxti, ierarxik tuzilish daraxti deb ham ataladi.
|
6 variant
5 savol) Korrelyatsion tahlil usullari uchun algoritmlar
|
Korrelyatsiya tahlili ikki yoki undan ortiq tasodifiy oʻzgaruvchilar oʻrtasidagi munosabatni oʻrganishning statistik usulidir. Empirik tadqiqotlarda tasodifiy o'zgaruvchilar sifatida o'zgaruvchilarning qiymatlari, o'rganilayotgan kuzatish ob'ektlarining o'lchangan xususiyatlari ishlaydi. Korrelyatsion tahlilning mohiyati korrelyatsiya koeffitsientlarini hisoblashdan iborat. Korrelyatsiya koeffitsientlari, qoida tariqasida, ijobiy va salbiy qiymatlarni qabul qilishi mumkin. Korrelyatsiya koeffitsientining belgisi ulanishning yo'nalishini va mutlaq qiymat - ulanishning kuchini izohlash imkonini beradi.
Korrelyatsiya koeffitsientlarini hisoblash usuli o'zaro bog'liqlik tekshirilayotgan o'zgaruvchilarning o'lchov shkalalariga bog'liq. Miqdoriy shkala (interval shkalasi yoki nisbatlar shkalasi) bo‘yicha o‘lchanadigan o‘zgaruvchilar uchun kovariatsiya yoki korrelyatsiya momenti, uning asosida esa chiziqli korrelyatsiya koeffitsienti (Pirson korrelyatsiya koeffitsienti) hisoblanadi.
|
7 variant
1 savol) Sirpanuvchi nazorat yordamida klassifikatsiya algoritmlarining umumlashtirish qobiliyatini aniqlash
|
An'anaviy tasniflash bilan solishtirganda, kontrast naqshlarining tasniflash aniqligi (Shiwei Zhu va boshqalar, 2015) an'anaviy tasniflagichga qaraganda yaxshiroq, chunki kontrast naqsh kuchli diskriminatsiya qobiliyatiga ega. Hozirgi vaqtda ko'plab kontrastli naqshlarni qazib olish algoritmi mavjud.
Ammo ushbu qazib olish algoritmlarining aksariyati ma'lumotlar to'plamining sinf taqsimoti muvozanat degan gipotezaga asoslanadi, masalan, Max-Miner algoritmi (Bayardo, R.J, 1998), Chenning JEP qazib olish algoritmi (CHEN Xiang-tao va boshqalar, 2010). ) va hokazo. Biroq, real hayotda ko'plab ma'lumotlar to'plamlari nomutanosibdir, odamlar kamdan-kam hollarda ma'lumotlar to'plamlari nomutanosibligi muammosini hisobga olishadi va kontrast naqshining oddiy ta'rifi muvozanatsiz ma'lumotlar to'plamlari uchun mos emas, chunki oddiy aniqlangan kontrast naqshlari. klassifikator ko'pchilik sinfiga burilib, ozchilik sinfining noto'g'ri tasniflanishiga olib keladigan muammoni hal qilish qiyin. Masalan, bankning kredit kartalaridagi firibgarlikni aniqlash (Sanjeev Jha va boshq, 2012) ma'lumotlari bilan shug'ullanayotganda, odamlar firibgarlik ma'lumotlarini ko'proq yozib olishdan xavotirda va o'rganilgan klassifikator modellari firibgarlik ma'lumotlarini aniqlash va tasniflashga ko'proq e'tibor qaratishlariga umid qilishadi. Bu hududlarda odamlar ozchiliklar sinfining ko'proq namunalarini aniq aniqlash mumkinligiga umid qilishadi.
|
7 variant
2 savol) Sun'iy intellektga asoslangan kompyuter tizimlari tahlili
|
Mashinani o'rganish kontseptsiyasi
Mashinani o'rganish sun'iy intellektning rivojlanishi bilan bog'liq - 1950-yillarning oxirida paydo bo'lgan yangi ilmiy intizom. O'shanda ham kiruvchi ma'lumotlar va bilimlar asosida o'z-o'zini tarbiyalay oladigan kompyuter modellari va algoritmlarini yaratish g'oyasi tug'ildi. Ushbu texnologiya ma'lumotlarni klassik statik tahlil qilishdan farq qiladi, chunki u usullar va o'rganish algoritmlarini qo'llaydi. Ushbu texnologiyada biz bir hil ma'lumotlarning barcha kichik to'plamlari atributlar orasidagi bir xil bog'liqlikni ko'rsatadi va atribut qiymatlarining taqsimlanishi butun to'plam bo'yicha uning xarakterini o'zgartirmaydi, degan gipotezadan boshlaymiz. ma'lumotlarni kiritish. Ushbu g'oyaga asoslanib, biz qo'shimcha resurslarni talab qiladigan hisob-kitoblarsiz yangi ma'lumotlar to'plamlariga keyinchalik qo'llanilishi mumkin bo'lgan algoritm yaratishimiz mumkin. Shunday qilib, mashinani o'rganishning mohiyati algoritmning kirish parametrlari va bilimlari to'plamiga to'g'ri mos kelishi va tegishli natijani berishi uchun algoritm jarayonida tizimni o'rgatishdir [5].
O'quv jarayoni quyidagi bosqichlarga bo'linadi:
- ma'lumotlarni yig'ish;
– foydalanishga tayyor shaklga ma’lumotlarni berish;
– Ma’lumotlarni ikki guruhga bo‘lish: algoritmdan foydalanish uchun ma’lumotlar va uning harakatlarini baholash uchun ma’lumotlar;
- trening;
- samaradorlik belgisi;
- Optimallashtirish.
Mashinani o'rganish bir nechta bog'liq va mustaqil o'zgaruvchilar bilan regressiya va tasniflash muammolarini hal qilish uchun ilg'or statistik usullarni o'z ichiga oladi. Ushbu usullar tasniflash va regressiya uchun Support Vector Machines (SVM) usuli, tasniflash uchun Bayes usuli va regressiya va tasniflash uchun k-Yaqin qo'shnilar (k-Yaqin qo'shnilar, KNN) usulini o'z ichiga oladi. Bugungi kunda ular rivojlanish bosqichida, ammo kelajakda ularning soni ortib borishi kutilmoqda, chunki turli vazifalarni hal qilish mashinani o'rganishning turli usullarini talab qiladi.
|
7 variant
3 savol) Alomatlarni tanlash metodlari. Alomatlarni tanlash metodlari murakkabligi. To'liq saralash.
|
Xususiyatlarni ajratib olish - bu abstraktsiyaning bir turi, o'lchamlarni qisqartirish jarayoni bo'lib, unda dastlabki o'zgaruvchilar to'plami keyingi qayta ishlash uchun boshqariladigan guruhlarga (xususiyatlarga) qisqartiriladi, shu bilan birga asl ma'lumotlar to'plamini aniq va to'liq tavsiflash uchun etarli to'plam qoladi [1] . Xususiyatlarni ajratib olish mashinani o'rganish, naqshni aniqlash va tasvirni qayta ishlashda qo'llaniladi. Xususiyatlarni olish dastlabki ma'lumotlar to'plamidan boshlanadi, ular uchun ma'lumot beruvchi va keraksiz bo'lishi kerak bo'lgan ikkinchi darajali qiymatlarni (xususiyatlarni) oladi, bu esa keyingi mashinani o'rganish va bosqichlarni umumlashtirish jarayoniga yordam beradi va ba'zi hollarda ma'lumotlarning insoniy talqini yaxshiroq.
Agar algoritmning kirish ma'lumotlari qayta ishlash uchun juda katta bo'lsa va ma'lumotlarning ortiqcha ekanligiga shubha tug'ilsa (masalan, o'lchovlar fut va metrlarda olinadi yoki tasvirning takrorlanishi piksellar bilan ifodalanadi), u holda ularni ma'lumotlarga aylantirish mumkin. qisqartirilgan xususiyatlar to'plami (xususiyat vektori deb ataladi) . Dastlabki xususiyatlarning kichik to'plamini belgilash xususiyat tanlash deb ataladi[2]. Tanlangan xususiyatlar kirish ma'lumotlaridagi kerakli ma'lumotlarning mazmuni bilan tekshiriladi, shuning uchun kerakli vazifani dastlabki to'liq ma'lumotlar o'rniga ushbu qisqartirilgan to'plam yordamida bajarish mumkin.
|
7 variant
4 savol) Parzen oynasining optimal kengligini hisoblash
|
Parzen-oyna usuli (Parzen-Rozenblatt oyna usuli sifatida ham tanilgan) p(xn) namunasidan ma'lum bir nuqta uchun p(x) ehtimollik zichligi funksiyasini p(x) baholash uchun keng qo'llaniladigan parametrik bo'lmagan yondashuvdir. asosiy taqsimot haqida hech qanday bilim yoki taxminni talab qilmaydi.
Uni kontekstga qo'yish - Bu usul qayerda foydali bo'ladi?
Parzen-deraza texnikasining mashhur qo'llanilishi o'quv ma'lumotlar to'plamidan nazorat qilinadigan naqsh tasniflash muammosidagi p(x | ōi) sinf shartli zichligini (yoki ko'pincha "ehtimollik" deb ham ataladi) baholashdir (bu erda p(x) ga tegishli). ma'lum bir sinf ōi) ga tegishli ko'p o'lchovli namuna.
Tasavvur qiling-a, biz Bayes qoidasidan foydalangan holda statistik naqsh tasniflash vazifasini hal qilish uchun Bayes klassifikatorini ishlab chiqmoqchimiz:
Bayes
Qoida
Agar sinfning shartli zichligi (ehtimollik deb ham ataladi) parametrlari ma'lum bo'lsa, tasniflagichni loyihalash juda oson. Men IPython daftarlarida Parametrik yondashuvlar bo'limida bir nechta oddiy misollarni hal qildim.
|
7 variant
5 savol) Mantiqiy korrelatsiya to'plami koeffitsentlarini hisoblash
|
“Korrelyatsiya” so‘zi “ko” va “munosabat” so‘zlarini birlashtirish orqali yasaladi. "Ko" so'zi birgalikda ma'noni anglatadi, shuning uchun korrelyatsiya birgalikda ko'rib chiqilganda har qanday ma'lumotlar to'plami o'rtasidagi munosabatni anglatadi.
Statistikada korrelyatsiya koeffitsienti -1 va +1 raqamlari orasida aniqlangan o'lchovdir va ma'lumotlar to'plamining chiziqli o'zaro bog'liqligini ifodalaydi.
Keling, quyidagi vaziyatni tahlil qilaylik:
Shamol tegirmonidan foydalangan holda elektr energiyasini ishlab chiqarish uchun, agar shamol turbinasi tezligi oshsa, ishlab chiqarish ishlab chiqarish mos ravishda oshadi. Shunday qilib, o'zgaruvchan tezlik va elektr quvvati bu erda ijobiy korrelyatsiyaga ega.
Bu korrelyatsiyani korrelyatsiya koeffitsienti yordamida o'rganish mumkin.
|
8 variant
1 savol) Mamdami metodi. Qat'iy bo'lmagan to'plamlar ustida amallar. Qat'iy bo'lmagan xulosa qoidalari.
|
* E. Mamdaniy. 1975 yilda u bug 'dvigatelini boshqarish usuli sifatida taklif qilingan algoritmni ishlab chiqdi. U tomonidan taklif qilingan loyqa mantiqiy xulosaga asoslangan algoritm haddan tashqari katta hajmdagi hisob-kitoblarning oldini olishga imkon berdi va mutaxassislar tomonidan munosib baholandi. Hozirgi vaqtda bu algoritm loyqa modellashtirish masalalarida eng katta amaliy qo'llanilishini oldi.
* Loyqa to'plamlardagi amallar oddiy to'plamlardagi amallarni umumlashtiradi. Ushbu operatsiyalar odatda a'zolik funktsiyasi qiymatlari bo'yicha elementlar bo'yicha aniqlanadi. Eng mashhur operatsiyalar a'zolik qiymatlari ustidagi minimal va maksimal operatsiyalar bilan aniqlangan loyqa to'plamlarning kesishishi va birlashuvidir.
Umuman olganda, minimal va maksimal o'rniga, mos ravishda T ning t-normalari va S ning t-konormalari qo'llaniladi, ular [0,1] bo'yicha assotsiativ, kommutativ, simmetrik ikkilik operatsiyalar sifatida belgilanadi, T(x,1) =x va S (x,0)=x.
Qo'shish operatsiyasi, shuningdek, a'zolik qiymatlari bo'yicha inkor qilish operatsiyasidan foydalanib, element bo'yicha ko'rsatiladi, bu odatda [0,1] da N(0)=1, N(1)=0 bo'lishi uchun o'smaydigan funksiya sifatida aniqlanadi. Eng oddiy inkor amali N(x)=1-x eng ommabop hisoblanadi.
*Fuzzy inference - bu ma'lum bir kirishdan chiqishga loyqa mantiq yordamida xaritalashni shakllantirish jarayoni. Keyin xaritalash qarorlar qabul qilinishi mumkin bo'lgan asosni yoki taniqli naqshlarni beradi. Loyqa xulosa chiqarish jarayoni a'zolik funktsiyalari, mantiqiy operatsiyalar va agar bo'lsa qoidalarida tavsiflangan barcha qismlarni o'z ichiga oladi.
Ushbu bo'lim loyqa xulosa chiqarish jarayonini tavsiflaydi va 2D kiritish misolidan foydalanadi, Asosiy Tipping muammosidan bitta chiqish bilan uch qoidali ag'darish muammosi. Ushbu muammo uchun loyqa xulosalar tizimi xizmat va mahsulot sifatini kirish sifatida qabul qiladi va quyidagi qoidalardan foydalangan holda maslahat foizini hisoblab chiqadi.
Agar xizmat yomon bo'lsa yoki ovqat chirigan bo'lsa, unda uchi kichik bo'ladi.
Agar xizmat yaxshi bo'lsa, unda maslahat o'rtacha bo'ladi.
Agar xizmat zo'r bo'lsa yoki taom mazali bo'lsa, unda uchi katta bo'ladi.
|
8 variant
2 savol) Ma'lumotlarni filtrlash, Ma'lumotlarni tartiblash, Ma'lumotlarni tozalash haqida tushuncha bering?
|
Filtrlash faqat Access ma'lumotlar bazalarida ko'rsatilishi kerak bo'lgan ma'lumotlarni ko'rsatishning foydali usuli hisoblanadi. Formada, hisobotda, so'rovda yoki jadvalda ma'lum yozuvlarni ko'rsatish yoki hisobot, jadval yoki so'rovdan faqat aniq yozuvlarni chop etish uchun filtrlardan foydalanishingiz mumkin.
Saralash - ma'lumotlarni ba'zi bir mezonlarga ko'ra tartiblash. Saralash variantlari. Saralashdan foydalanib, siz bir xil qiymatlarga ega ma'lumotlarni bitta ustunda yoki bitta satrda tashkil qilishingiz mumkin. Bundan tashqari, o'xshash qiymatlarning barcha guruhlarini saralashingiz mumkin.
Очистка данных (англ. Datacleaning) — процесс выявления и исправления ошибок, несоответствий данных с целью улучшения ix качества, иногда классифицируется как составная часть интеллектуального анализа данных. Очистка данникс выполняется с определенными наборами данникс в базакс данникс или фаилакс.
|
8 variant
3 savol) Berilganlarni intellektual tahlili tizimining klassifikatsiyasi. Berilganlar ombori. Yechimlar daraxti. Bilimni tavsiflash modellari.
|
* Ma'lumotlarni qidirish tizimini quyidagi mezonlarga ko'ra tasniflash mumkin
Ma'lumotlar bazasi texnologiyasi
Statistika
Mashinani o'rganish
Axborot fani
Vizualizatsiya
Boshqa fanlar
Ma'lumotlarni qidirish tizimlari
Bundan tashqari, ma'lumotlarni qidirish tizimini (a) qazib olingan ma'lumotlar bazalari, (b) qazib olingan bilimlar, (c) foydalanilgan usullar va (d) moslashtirilgan ilovalar turiga qarab tasniflash mumkin.
* Ma'lumotlar ombori - bu tashkilotda qaror qabul qilishni qo'llab-quvvatlash uchun hisobot berish va biznes tahlili uchun maxsus ishlab chiqilgan va ishlab chiqilgan domenga xos ma'lumotlar bazasi. U ma'lumotlar bazasini boshqarish tizimlari va qarorlarni qo'llab-quvvatlash tizimlari asosida qurilgan. Ma'lumotlar omboriga kiruvchi ma'lumotlar odatda faqat o'qish uchun mo'ljallangan.
OLTP tizimidagi ma'lumotlar ma'lumotlar omboriga shunday ko'chiriladiki, hisobotlarni tuzishda va OLAP tahlilini tuzishda tranzaksiya tizimining resurslaridan foydalanilmaydi va uning barqarorligi buzilmaydi. Saqlashdagi ma'lumotlarni yangilashning ikkita varianti mavjud:
ombordagi ma'lumotlarni to'liq yangilash. Birinchidan, eski ma'lumotlar o'chiriladi, keyin yangi ma'lumotlar yuklanadi. Jarayon ma'lum bir chastotada sodir bo'ladi, shu bilan birga ma'lumotlarning dolzarbligi OLTP tizimidan biroz orqada qolishi mumkin;
qo'shimcha yangilanish - faqat OLTP tizimida o'zgargan ma'lumotlar yangilanadi.
*Qarorlar daraxti - bu katta ma'lumotlar massivlarini avtomatik tahlil qilish usuli. Ushbu maqolada biz ishlashning umumiy tamoyillarini va qo'llash sohalarini ko'rib chiqamiz.
Qarorlar daraxti - bu kuchli ma'lumotlarni yig'ish va bashoratli tahlil qilish vositasi. Bu tasniflash va regressiya muammolarini hal qilishda yordam beradi.
Qaror daraxti - bu "Agar ..., keyin ..." shaklidagi qoidadan iborat bo'lgan ierarxik daraxt tuzilmasi. O'quv majmuasi tufayli qoidalar o'quv jarayonida avtomatik ravishda hosil bo'ladi.
|
8 variant
4 savol) Sinf ichidagi o'xshashlik va sinflararo farq kriteriyasi asosida alomat shkalasini intervallarga ajratish.
|
Chiziqli diskriminant funktsiyalari (LDF) ma'lumotlarni qidirish muammolarida keng qo'llaniladi. Hisoblash resurslarining arzonligi, tan olish natijalarini yangi bilim sifatida mazmunli talqin qilish imkoniyati - bu jarayonlar va hodisalarni modellashtirishda ularning qo'llanilishini yomon rasmiylashtirilgan mavzularda topadigan xususiyatlar.
LDF ning kompyuterda amalga oshirilishi pretsedent jadvalini talab qilmaydi, xotirada faqat xususiyat og'irliklarini saqlash kifoya. Texnik qurilmalarda LDF elektron sxemalar va mikrochiplar shaklida taqdim etilishi mumkin.
Tanib olish aniqligi ko'rsatkichlari uchun sinf ob'ektlarining chiziqli bo'linishi kabi xususiyat fazosining bunday xususiyati katta ahamiyatga ega. Ushbu xususiyatni aniqlashning bir usuli chiziqli bo'lmagan xususiyatlarni o'zgartirishdan foydalanishdir.
|
8 variant
5 savol) Ierarxik aglomerativ guruhlash qoidasi bo'yicha latent alomatlarni sintez qilish
|
Umumlashtirilgan baholar - bu [1] da raqamli o'qda har xil turdagi xususiyat fazosida ikki sinf ob'ektlari o'rtasidagi munosabatlarni ko'rsatish uchun ishlatilgan jamlangan (birlashtirilgan) ko'rsatkichlar. Baholarni hisoblashning ikkita usuli ishlab chiqilgan: stokastik va deterministik. Stokastik usul algoritmining parametrlarini tanlash mezoni turli sinflarga mansub ikkita ob'ektning chiziqli proyeksiyalari orasidagi maksimal farq (chekinish) edi. Boshqa sinfning maksimal qiymati bitta sinfning raqamli o'qi bo'yicha minimal qiymatdan ayirildi.
Usulning qo'llanilishidan biri ob'ektlarning tavsiflarini (vizualizatsiyasini) tekislikda ko'rsatish edi [2].
Deterministik usulning algoritmi dominantlik oraliqlariga bo'linishdan foydalangan
ikki sinfdan biridagi ob'ektlarning miqdoriy xususiyatlarining qiymatlari. Umumlashtirilgan hisoblashda
ob'ektni baholash uchun dominantlik oraliqlarida a'zolik funktsiyalarining qiymatlari ishlatilgan
miqdoriy belgilar va nominal belgilar uchun gradatsiyalarning paydo bo'lish chastotasi.
|