301
Ruxsatsiz kirishlarni aniqlash uchun ML algoritmi.
ML - Sun’iy intellekt (AI)
ning quyi qismidir. ML tizimni aniq dasturlashtirilmasdan tajribadan o’rganish va
takomillashtirishga imkon beradi. Intrusion Detection System (IDS) uchun ML
algoritmi qisqa vaqt ichida katta miqdordagi ma’lumotlarga hujumlarni aniqlashda
aniqroq ishlaydi. Odatda, ML algoritmlarini uchta toifaga ajratish mumkin:
• supervised
• unsupervised
• semi-supervised.
1. Supervised ML algoritmi
. Supervised to’liq sinfga tegishli ma’lumotlar
bilan ish olib boradi va ma’lumotlar va ularning sinfi o’rtasidagi bog’liqlikni
topadi. Bu tasniflash yoki regressiya orqali amalga oshirilishi mumkin. Tasniflash
mashg’ulotlar va sinovlar kabi ikki bosqichdan iborat.
1.1 Support Vector Machine
(SVM).
SVM - bu ko’pincha qo’llaniladigan ML
algoritmlaridan biri.
SVM ham tasniflash, ham regressiya uchun ishlatilishi
mumkin. Algoritmni yorliqli ma’lumotlar bilan o’rgatish mumkin va u barcha
hujum sinflari orasida chegarani maksimal darajaga ko’taradigan giper tekislik
orqali ma’lumotlarni sinflarga ajratishni chiqarishi mumkin. Mehmud va boshq. [4]
SVM ikkilik klassifikator sifatida, shuningdek kaskad usulidan foydalangan holda
ko’p sinfli tasniflashni amalga oshirishi mumkin. SVM asosan ishlatiladigan yadro
turlariga va parametrlariga bog’liq.
1.2 Logistik regressiya (LR).
LR - bu sinflarning diskret to’plamini
kuzatish
uchun ishlatiladigan boshqariladigan ML tasniflash algoritmi. Logistik funktsiya
sigmasimon funktsiya deb ataladigan xarajatlar funktsiyasidan foydalanadi. Ushbu
funktsiya bashoratlarni ehtimolliklar bilan taqqoslaydi. Belavagi va boshq. [1]
ma’lumotni logistik funktsiyaga moslashtirish orqali hodisa ro’y berish ehtimolini
taxmin qilish mumkinligini ta’kidladi. Sigmoid funktsiyaning formulasi:
𝐹(𝑥) =
1
1+𝑒
−(𝑥)
Bu yerda
F(x)
0 va 1 orasidagi chiqish,
x
funktsiya uchun kirish,
e
esa tabiiy jurnalning asosidir.
1.3 Linear Discriminant Analysis
(LDA)
. LDA - bu o’lchovni kamaytirish va
bashorat qilish uchun ishlatiladigan oddiy chiziqli boshqariladigan ML algoritmi.
Bayes teoremasiga asoslanib, LDA yangi yozuvlarning qaysi sinfga tegishli bo’lish
ehtimolini taxmin qiladi [2].
𝑃(𝑌 = 𝑥 ǀ 𝑋 = 𝑥) =
(𝑃ǀ𝑘∗𝑓𝑘(𝑥))
𝑠𝑢𝑚(𝑃ǀ𝑘∗𝑓(𝑥))
Bu erda
k(x)
- chiqish klassi,
x
- kirish klassi,
f(x)
- taxmin qilingan ehtimollik va
𝑃
|
𝑘
- oldingi ehtimollik.
1.4 Classification and Regression Tree
(CART)
CART
- tasniflash va
regressiya uchun ishlatiladigan oddiy chiziqli bo’lmagan boshqariladigan ML
algoritmi. CART-da maqsad o’zgaruvchisi kategorik bo’lishi kerak, regressiya
daraxtida esa maqsad o’zgaruvchisi doimiy bo’lishi kerak. CART-da Gini indeksi
bu tasniflash uchun ishlatiladigan ko’rsatkichdir [2].
𝐺𝑖𝑛𝑖 𝑖𝑛𝑑𝑒𝑥 = 1 − ∑
𝑃𝑖
𝑐
𝑖=1
Bu yerda, c - sinflar soni va
𝑃
i
- ma’lumotlar to’plami-
dagi har bir sinfning ehtimolligi.
1.5 Random Forest (RF)
RF - bu tasniflash va regressiya uchun ishlatiladigan
murakkab chiziqli bo’lmagan boshqariladigan algoritm.
302
Bu modelni o’qitishda ko’plab qaror daraxtlarini barpo etadi va natijada
barcha daraxtlarning bashorat qilish natijalari birlashtirilib,
natijada Ansambl
texnikasi sifatida qayd etiladi. RF chastotalari quyidagicha ishlaydi: modeldagi
daraxtlar soni qancha ko’p bo’lsa, aniqlik yuqori bo’ladi va modelga haddan
tashqari mos kelmaydi.
1.6 Ansambl usullari
. Optimal bashoratli modelni ishlab chiqarish uchun
ushbu ML texnikasi bir nechta modellarni birlashtiradi.
Ansambl usulining asosiy
g’oyasi - kuchli o’quvchini shakllantirish uchun barcha zaif o’quvchilarni
birlashtirish; shu bilan modelning aniqligi oshiriladi. Ansambl usullarining ba’zi
keng tarqalgan turlari - bu paketlash, kuchaytirish va bashoratlash. Gautam va
boshq. [3] torbalar ansambli uslubiga yaqinlashdi va Naive Bayes, qisman qaror
daraxtlari algoritmi (PART) va Adaptive Boost bilan izni ishlab chiqdi. Ular
ansamblning
yondoshuvi PART, Naive Bayes va Adaptive Boost-dan yuqori
ko’rsatkichga ega ekanligini ko’rsatdi.
Internetdan foydalanishning tez sur’atlarda o’sishi va juda katta miqdordagi
qimmatli raqamli ma’lumotlarning paydo bo’lishi tajovuzkorni noqonuniy ravishda
iqtisodiy foyda olishga jalb qiladi va hokazo. Ushbu maqolada turli xil muhitlarda
IDS uchun ishlatiladigan ML algoritmlari o’rganilgan. Ushbu tadqiqot aniqlanish
darajasi, noto’g’ri ijobiy tezlik va aniqlik nafaqat algoritmga,
balki dastur
maydoniga ham bog’liqligini bildiradi.
Foydalanilgan adabiyotlar
[1] Belavagi, M. C., &Muniyal, B. (2016) “Performance evaluation of supervised machine
learning algorithms for intrusion detection.”
Procedia
Computer Science
89(1): 117-123.
-
Ganapathy, S., Kulothungan, K., Muthurajkumar, S., Vijayalakshmi, M., Yogesh, P.,
&Kannan, A. (2013) “Intelligent feature selection and classification techniques for intrusion
detection in networks: a survey.”
EURASIP Journal on Wireless Communications and
Networking
(1): 271.
-
Gautam, R. K. S., &Doegar, E. A. (2018) “An Ensemble Approach for Intrusion Detection
System Using Machine Learning Algorithms.”
International Conference on Cloud Computing,
Data Science & Engineering (Confluence)
: 14-15.
-
Ghasempour, A. (2019). Internet of Things in Smart Grid: Architecture, Applications,
Services, Key Technologies, and Challenges.
Inventions
4
(1): 22.
Do'stlaringiz bilan baham: