Uchun tahlil ma'lumotlar ishlatilgan yig'ilgan avval Arxiv ma'lumotlar dan metadata da tasvirlangan stol 3.2.
Shunday qilib Qanday metadata bor katta raqamli sochmoq parametrlar, zarur murojaat qiling normallashtirish ma'lumotlar uchun eng zo'r klasterlash. Normalizatsiya taklif qiladi uchun hammasi namuna (har biri chiziq matritsalar) zarur parametrlari masshtabli ichida diapazon [0, bir], da bu almashtirish kiruvchi paketning har bir parametrining nominal raqamli qiymati [190]. Uchun trening Va tahlil ma'lumotlar ishlatilgan python kutubxonalari: sklearn Va modul amalga oshirish k -eng yaqin algoritmlar qo'shnilar Eng yaqin
Qo'shnilar [188].
LOF algoritmini amalga oshirish uchun siz kutubxonadan foydalanishingiz kerak LocalOutlierFactor [189].
Uchun tanlash eng zo'r parametrlari foydalanish Keyingi algoritm:
administrator tanishtirdi cheklash ustida aniqlash anomaliyalar ichida tarmoqlar parametr - {c} Va hajmi Turar joy dahasi paketlar ichida bitta klaster - {k};
uchun hamma aniqlangan dan Turar joy dahasi klaster anomaliyalar zarur murojaat qiling:
o'rnatish ma'nosi o'rtacha ma'nosi M Va dispersiya V , mos ravishda, o'zgargan qiymatlarning mahalliy qiymatlarining logarifmi bashorat qilingan anomaliyalar;
kutamiz koeffitsienti T orasida bashorat qilingan anomaliyalar va normal nuqtalar;
hisoblash dalil maksimallashtirish anomaliyalar { opt } _ uchun berilgan Turar joy dahasi. Shunday qilib , optimal 𝑐 T bo'lgan joydir eng buyuk miqdoriy.
Natija klasterlash
Anomaliyalarni qidirishning to'g'riligini baholash uchun ma'lumotlar to'plami ishlatilgan NSL-KDD [194]. 3.6-jadvalda foydalanish bo'yicha ma'lumotlar keltirilgan o'rnatish ma'lumotlar.
stol 3.6. Tavsif ishlatilgan sinov namunalar
Ism
|
Hajmi
|
Anomaliyalar soni /hajmi
o'rnatish ma'lumotlar
|
Ko'p yuzli
|
2D
|
2221/10000(22%)
|
Sferalar
|
3D
|
93/637(15%)
|
3.6-rasmda F ball va AUC ko'rsatilgan grafiklar ko'rsatilgan mos ravishda ichida o'rnatish cheklar uchun boshqacha qiymatlar parametrlari uchun ko'p yuzli. Oklar tanlangan variantlarga ishora qiladi Yordam bering taklif qilingan usuli sozlamalar, qayerda tanlangan ifloslanish teng 0,01 va hajmi Turar joy dahasi teng 16.
Rasm 3.6. Grafiklar taxminlar ko'rsatkichlar F Va AUC uchun ko'p yuzli
IN stol 3.7 ifodalangan natijalar uchun ikki to'plamlar ma'lumotlar, qayerda taklif qilingan usul optimal LOF parametrlarini sozlaydi. 3.7-jadval. Foydalanishda anomaliyalarni aniqlashning aniqligini baholash usuli sozlamalar parametrlari
Ism o'rnatish ma'lumotlar
|
s, daraja ifloslanish
|
k, hajmi atrofida sti
|
F o'lchov
|
ROC_AUC
|
Keyin sozlamalar.
|
Oldin sozlamalar
|
Keyin sozlamalar.
|
Oldin sozlamalar
|
Ko'p yuzli
|
0,01
|
16
|
0,981
|
0,894
|
0,947
|
0,863
|
Sferalar
|
0,01
|
48
|
0,930
|
0,861
|
0,875
|
0,822
|
Anomaliyalarni aniqlash asosida olingan natijani tahlil qilish tarmoq trafigi uchun biz oldindan tayyorlangan ma'lumotlar to'plamidan foydalanamiz, bu nafaqat DDoS hujumlarini emas, balki turli xil tarmoq hujumlarini o'z ichiga oladi. Ushbu to'plamda muhitda moderatsiya qilingan ko'plab kirish naqshlari mavjud harbiy tarmoqlar. Xususiyat zararli hujumlar hisoblanadi tarmoq tirbandlik, http protokolida mavjud. To'plam har biri 623091 qatordan iborat string bitta Internet ulanishini nazarda tutadi, to'plam esa o'z ichiga oladi 4045 variantlari har xil bosqinlar (taqlid anomaliya tarmoq transport). Shunday qilib bir xil to'plam o'z ichiga oladi ICMP trafik, o'z ichiga olgan 68321 chiziq, dan shundan 100 tasi paketlar bor anomaliya [191, 194].
Http trafikiga qo'shimcha ravishda, ishlab chiqilgan ishini tekshirish tavsiya etiladi usuli ustida smtp tirbandlik, keyin yemoq tirbandlik, atributlar kim avval emas uchrashdi. To'plam o'z ichiga oladi 95156, dan qaysi 1180 chiziqlar o'z ichiga oladi anormallik belgilari paketlar kiritish ma'lumotlar [192].
Anomaliyani aniqlashni qo'shimcha tekshirish uchun to'plam olindi ma'lumotlar mnist. To'plam 12 665 dan iborat tasvirlar namunalar uchun raqamlar "0" Va
"bir", qaysi belgilangan Qanday normal ma'lumotlar ichida bu xos ilova. IN sifat anomaliyalar o'z ichiga olgan 7 885 (78,9%) loyqa tasvirlar raqamlar. The to'plam hisoblanadi mehnatkash uchun protseduralar klasterlash [193].
Reytinglar ROC AUC Va daraja aniqlik qidirmoq anomaliyalar ichida to'plamlar ma'lumotlar ifodalangan ustida raqam 3.7, aniqlik taxmini 3.8-rasmda.
Rasm 3.7. Baho ROC-AUC
Rasm 3.8. Baho aniqlik AUC
Baholash natijalariga ko'ra, usulni qo'llash degan xulosaga kelish mumkin sozlamalar giperparametrlar imkon beradi mahsulot Ko'proq aniq aniqlash anomaliyalar ichida har xil to'plamlar ma'lumotlar, yoqilgan solishtirish dan belgilangan parametr qiymatlari c va k.
Do'stlaringiz bilan baham: |