Obyektlarni sinflarga ajratish masalasining umumiy matematik formallashtirilishi. Obyektlarni sinflarga ajratish masalasining umumiy matematik formallashtirilishi quyidagicha [93].
Aytaylik, bizga OT va unga ekvivalent toʻplam berilgan boʻlsin. - toʻplamda aniqlangan ehtimoliy taqsimot funksiya. toʻplam elementlarini guruhlash natijasida hosil boʻlgan sinflarni deb belgilaymiz. U holda funksiya ni guruhlarga ajratuvchi funksiya deb aytamiz, agarda quyidagi shartlarni qanoatlantirsa:
-har bir uchun
(8.1)
boʻlsaki, barcha bajarilsa ( -haqiqiy oʻq belgisi).
Bu yerda - toʻplamni shakl almashtirganda, uning oʻzgarmaydigan ba’zi bir xossalari toʻplami.
Obyektlarni guruhlarga ajratishda optimal yechimga ega boʻlish uchun funksiya nafaqat (8.1) formulani qanoatlantirishi, balkim quyidagi maqsad funksiya
(8.2)
minimal qiymatga ega boʻlishi kerak.
Obyektlarni sinflarga ajratish usullari. Obyektlarni avtomatik sinflash masalasini quyidagi guruhlarga boʻlish mumkin [71]:
masalaning qoʻyilishiga qarab - deterministik va stoxastik yoki ehtimolli masalalar;
masalani yechish yoʻliga qarab - iyerarxik va iyerarxik emas;
sinflar soni haqidagi boshlangʻich ma’lumotning aniqligi yoki aniqmasligi;
QQQQ yaqinlik oʻlchoviga asoslanganmi yoki yoʻq.
Bu masalalarni alohida - alohida qarab chiqamiz.
Aytaylik Evklid fazosi dan olingan chekli tanlanma boʻlsin. - nuqtaning (tasvirning) toʻplamda mavjud boʻlish ehtimoli boʻlsin.
Deterministik masalaning qoʻyilishida
(8.3)
aniqlash talab etiladi. Bu holda obyektni sinfga taalluqli ekanligini aniqlovchi funksiyani topish talab etiladi. Agar funksiya masofalarni hisoblashga asoslansa, u holda
(8.4)
foydalaniladi. (8.4) formulaga asosan, chekli tanlanmadagi obyektlar orasidagi masofa berilgan qiymat (boʻsagʻa)dan katta yoki teng boʻlsa, turli sinflarga, aks holda bitta sinfga qarashli boʻladi.
Agar masala stoxastik yoki ehtimollik koʻrinishda qoʻyilsa, u holda QQQQ sifatida
(8.5)
topish talab etiladi. Bu yerda - sinflar; - X obyektning sinfga qarashliligining ehtimollik darajasi.
Oʻxshashlik oʻlchoviga asoslangan usullar asosan topologik fazoda ba’zi oʻxshashlik oʻlchovini berishga asoslanadi. Bu holda ixtiyoriy va obyektlar orasidagi oʻxshashlik oʻlchovi sifatida qandaydir son qaraladi. Umumiy holda oʻxshashlik oʻlchovi quyidagi shartlarni qanoatlantirishi kerak:
.
Amaliyotda asosan uch turdagi oʻxshashlik oʻlchovidan foydalaniladi:
Oʻxshashlik koeffitsiyenti;
Bogʻliqlik koeffitsiyenti;
Metrik fazoda masofa koʻrsatkichi.
Oʻxshashlik koeffitsiyentini hisoblashga asoslangan usullar asosan binar belgilar bilan berilgan obyektlarni sinflarga ajratishda qoʻllaniladi. Bu holda va obyektlarning oʻxshashligini aniqlashda quyidagi chastota belgilari kiritiladi:
- va obyektlardagi mos tushadigan (1,1) juftliklar soni;
- va obyektlardagi mos tushadigan (0,0) juftliklar soni:
- obyektdagi 1 qiymatga ega belgilar va obyektdagi 0 qiymatga ega belgilar soni;
- obyektdagi 0 qiymatga ega belgilar va obyektdagi 1 qiymatga ega belgilar soni;
- obyektdagi 1 qiymatga ega belgilar soni va obyektdagi 1 qiymatga ega belgilar soni;
- obyektdagi 0 qiymatga ega belgilar soni va obyektdagi 0 qiymatga ega belgilar soni;
- mos tushuvchi belgilarning umumiy soni, ya’ni ;
- mos tushmovchi belgilarning umumiy soni, yani ;
m - va obyektlarda taqqoslanadigan umumiy belgilar soni.
Bu qiymatlar orqali ifodalanadigan oʻxshashlik funksiyalar soni sifatida quyidagilarni keltirish mumkin: , .
0 va 1 qiymatga ega boʻlgan belgilarning muhimligi bir xil boʻlganda ishlatiladi.
Rao koeffitsiyenti - .
Xamman koeffitsiyenti - , bunda .
Rodjers va Tonimoto koeffitsiyenti - .
Dekard koeffitsiyenti - .
Deyka koeffitsiyenti - .
Mos tushmaydigan belgilar koʻproq e’tiborga olinsa - .
Kompozitsion oʻxshashlik koeffitsiyenti -
Yuqorida keltirilgan koeffitsiyentlar oʻxshashlik koeffitsiyentlari deyiladi va orqali belgilanadi.
Bogʻliqlik koeffitsiyenti sifatida quyidagini keltirish mumkin:
,
bu yerda - va belgilar orasidagi bogʻliqlik koeffitsiyenti, - obyektdagi - belgining qiymati. Bu koeffitsiyent va belgilar binar va sonli qiymatlar qabul qilganda ishlatilishi ham mumkin.
4. Metrik fazoda masofa koʻrsatkichida va obyektlar orasida oʻxshashlik ular orasidagi masofaga asoslanadi. Bu holda eng asosiy masala va obyektlar orasidagi masofani qanday hisoblashga bogʻliq. Masofani hisoblashda yuqorida keltirilgan shartlarga qoʻshimcha ravishda quyidagi uchburchak qoidasi ham bajarilishi kerak:
Quyida va obyektlar orasidagi masofalarni hisoblash usullari bilan tanib olishamiz.
Agar va obyektlar binar belgilardan iborat boʻlsa, ular orasidagi masofa Xemming formulasi bilan hisoblanadi: .
Agar va obyektlar sonli belgilar bilan berilsa, u holda masofa Evklid formulasi orqali aniqlanadi.
Evklid masofasini hisoblashning quyidagi koʻrinishidan ham foydalaniladi:
.
Koʻp hollarda Evklid masofasi oʻrniga foydalaniladi.
Potensial funksiyalarda umumlashgan masofani hisoblash formulasi foydalaniladi. Bu yerda potensial funksiya boʻlib, aniqlanadi. , - funksiyalar sistemasi.
Agar k-oʻlchovli fazoni Evklid fazosi va - va obyektlarning skalyar koʻpaytmasi deb qaralsa, u holda umumlashgan masofa oddiy
Evklid masofasiga aylanadi.