International scientific conference "INFORMATION TECHNOLOGIES, NETWORKS AND
TELECOMMUNICATIONS" ITN&T-2022 Urgench, 2022y April 29-30
583
активности, позволяют выявлять странности трафика и анализировать
статистику доступа к серверам. Технологии машинного обучения
способствуют максимально эффективно использовать полученные данные о
безопасности и в связи с этим получают все большее распространение в
сфере информационной безопасности [2].
Существует множество методов машинного обучения. Самыми
популярными являются 2 вида
классического Machine Learning:
2.1.
Обучение с учителем
Обучение с учителем — в процессе своей
работы обученная система
или сеть получает набор входных данных - прецеденты или обучающую
выборку. Случаи представляют собой набор данных с заранее заданным
рейтингом или классификацией. В процессе обучения система устанавливает
связь между элементами обучающей выборки и их оценкой. После обучения
качество проверяется с помощью тестовой выборки. Технология обучения
имеет ряд особенностей, недостатков и преимуществ,
которые влияют на
класс задач, подходящих для данной методики [3].
Преимущества обучения с учителем:
Высокая устойчивость к шумам и помехам – случайные данные и ошибки
легко фильтруются и отсеиваются еще на этапе анализа предметной
области;
Эффективная классификация объектов;
Недостатки обучения с учителем:
Большие объемы обучающей выборки – высокое качество работы
системы достигается при значительных объемах обучающей выборки;
Возникновение ошибок при оценке новых данных, схожие с которыми не
представлены в обучающей выборке;
Необходимость точной оценки прецедентов из обучающей выборки;
2.2
Обучение без учителя
Обучение без учителя –тут отсутствует оценки прецедентов
обучающей выборки. Именуется так же спонтанным обучением. В
связи с
биологической правдоподобностью, позволяет эффективно находить
внутренние взаимосвязи без коррекции извне при помощи обратной связи.
Используются для визуализации сложных данных [4].
Преимущества обучения без учителя:
Высокое качество работы системы при малых размерах обучающей
выборки или ее полном отсутствие;
Эффективная кластеризация объектов и
нахождение неочевидных и
сложных взаимосвязей между объектами;
Визуализация данных (обычно двухмерная) для дальнейшего анализа
экспертами;
Значительное снижение разрядности данных;
При этом, обучение без учителя обладает рядом недостатков:
International scientific conference "INFORMATION TECHNOLOGIES, NETWORKS AND
TELECOMMUNICATIONS" ITN&T-2022 Urgench, 2022y April 29-30
584
Сложности при классификации объектов – вызваны отсутствием
обратной связи и поправки оценки системы;
Эффективная кластеризация объектов и нахождение неочевидных и
сложных взаимосвязей между объектами [5].
2.3
Искусственная иммунная система
Искусственная
иммунная
система
представляет
собой
автоматизированную компьютерную систему, имитирующую иммунную
систему позвоночных. Используется для решения прикладных задач модели,
принципов, механизмов и функций иммунной системы. Основан на теориях
отрицательного отбора, клонального отбора и иммунных сетей. Включается в
себя основные механизмы – обучение, запоминание, ассоциативный поиск
схожих
данных и реакция на данные, не имущие аналогов в обучающей
выборке [6]. Чаще проводят аналогии с обучением без учителя, что позволяет
говорить о соответствующих преимуществах и недостатках.
Do'stlaringiz bilan baham: