Ўзбекистон республикаси ахборот технологиялари ва коммуникацияларини ривожлантириш вазирлиги муҳаммад ал-хоразмий номидаги


МЕТОД НЕЙРОННЫХ СЕТЕЙ И DATA MINING



Download 4,05 Mb.
Pdf ko'rish
bet60/87
Sana28.05.2022
Hajmi4,05 Mb.
#614253
1   ...   56   57   58   59   60   61   62   63   ...   87
Bog'liq
28-29-aprel

 
МЕТОД НЕЙРОННЫХ СЕТЕЙ И DATA MINING 
Ш.С. Ташматова (ТГТУ, старший преподаватель) 
Б.П. Бойсунов (ТГТУ, студент) 
В связи с бурным ростом информационного общества компании активно 
внедряют различные средства цифровой обработки баз данных, стремясь 
повысить уровень прибыльности и эффективности бизнеса. В результате 
работы подобных информационных систем на серверах организаций хранятся 
колоссальные объёмы потенциально полезных данных. Применяя технологии 
Data Mining можно выявить неочевидные, неожиданные тенденции и скрытые 
знания, о существовании которых даже не предполагалось. Определение 
технологии Data Mining ввёл основатель интеллектуального анализа Григорий 
Пятецкий-Шапиро в 1992 году.
Согласно его определению Data Mining – это процесс обнаружения в 
сырых данных ранее неизвестных, нетривиальных, практически полезных, 
доступных интерпретации знаний, необходимых для принятия решений в 
различных сферах человеческой деятельности. Дословный перевод – «раскопки 


142 
(или добыча) данных» [1]. Интеллектуальный анализ данных является методом 
обнаружения ранее неизвестных закономерностей, тенденций и свойств в 
больших наборах данных. Методы Data Mining основаны на различных 
научных дисциплинах, таких, как статистика, искусственный интеллект, теории 
баз данных, алгоритмизация, визуализация и др. Модель технологии Data 
Mining должна иметь возможность самостоятельно обнаруживать в данных 
скрытые закономерности и приобретать необходимые свойства для их 
отражения. Подобные модели имеют название – обучаемые, а комплекс 
методов для создания таких моделей называется – машинным обучением [2]. 
Понятие интеллектуального анализа данных обозначает не конкретную 
технологию, а сам процесс поиска корреляций, тенденций, взаимосвязей и 
закономерностей с помощью применения математических и статистических 
алгоритмов, таких как: кластеризация, создание выборок, регрессионный и 
корреляционный анализ. Результатом данного поиска должны выступать 
данные, представленные в виде, чётко отражающем бизнес-процессы, а также 
модель данных, предназначенная для прогнозирования процессов, критичных 
для планирования бизнеса [3]. Data Mining является частью процесса 
Knowledge Discovery in Databases (KDD), данный термин обозначает выявление 
знаний в базах данных и описывает последовательность действий, необходи-
мых для построения модели. Этими знаниями могут быть правила, описываю-
щие связи между свойствами данных (деревья решений), часто встречающиеся 
шаблоны (ассоциативные правила), а также результаты классификации 
(нейронные сети) и кластеризации данных (карты Кохонена) и т.д. 
Процесс Knowledge Discovery in Databases, состоит из следующих шагов: 
1. Подготовка исходного набора данных. Создаётся набор данных из 
различных источников, формируется обучающая выборка. 
2. Предобработка данных. Для эффективного применения методов Data 
Mining следует корректно подготовить данные. Необходимо проверить данные 
на наличие пропусков, шумов, аномальных значений. Кроме того, данные 
могут быть избыточны, недостаточны и т.д. 
3. Трансформация, нормализация данных. Приведение данных к 
пригодному для последующего анализа виду. 
4. Data Mining. Применение различных алгоритмов для нахождения 
связей и закономерностей. Могут применяться нейронные сети, деревья 
решений, алгоритмы кластеризации, установления ассоциаций и т.д. 
5. Постобработка данных. Интерпретация результатов и практическое 
применение полученных знаний. 
Выявленные закономерности и тренды можно собрать в единую модель 
интеллектуального анализа данных и применять для развития следующих 
сценариев: 
• Классификация. Выявление признаков, позволяющих отнести объект к 
определённому классу. 


143 
• Кластеризация. Задача, позволяющая группировать объекты в заранее 
неизвестные классы. 
• Ассоциация. Поиск закономерностей в событиях. 
• Выявление последовательностей. Выявление закономерностей, 
связанных временным постоянством. 
• Прогнозирование. Выявление зависимости выходных данных от 
входных переменных. 
• Визуализация. Графическое представление анализируемой информации. 
Выделяют 7 групп инструментов Data Mining [4]: 
• Инструменты DM (DMFT – Data Mining Field Tools) – данные 
инструменты направлены на особую прикладную область. 
• Инструменты для бизнес-аналитики (DMBT – Data Mining Business 
Tools) – не ориентированы на работу с задачами Data Mining, но поддерживают 
методы интеллектуальной обработки данных. 
• Инструменты DM (RDMT – Research Data Mining Tools) – данные 
инструменты используются для разработки новых экспериментальных 
алгоритмов и методов интеллектуальной разработки данных. 
• Математические пакеты (DMMP – Data Mining Mat Package) – данные 
пакеты не были ориентированы для Data Mining, но они содержат огромное 
количество алгоритмов и методов, которые позволяют осуществлять функции 
интеллектуального анализа данных. 
• Инструменты DM (SDMT – Specialties Data Mining Tools) — данные 
инструменты используются для определенных видов или методов 
интеллектуальной обработки данных. 
• Интеграционные пакеты (IDMT – Integration Data Mining Tool) – наборы 
алгоритмов, образующих либо отдельные программные средства, либо пакеты 
расширения. 
• «Наборы» интеллектуальной обработки данных (DMST – Data Mining 
Suite Tools) – поддерживают целый спектр алгоритмов и методов 
интеллектуальной обработки данных. Ориентированы на работу с различными 
структурированными и неструктурированными данными. 
Искусственные нейронные сети – математические модели, а также их 
программные или аппаратные реализации, построенные по принципу 
организации и функционирования биологических нейронных сетей [5]. 
Нейронные сети, как инструмент анализа данных обрели свой 
первоначальный вид в 1943 году в работе Уоррена Мак-Каллока и Вальтера 
Питтса, содержащей модель искусственного нейрона. [6]. Авторы выдвинули 
гипотезу математического нейрона, способного моделировать нейрон мозга 
человека. Данный нейрон так же имеет несколько входов и один выход. 
Выходной сигнал нейрона может иметь два значения – нуль или один. 
Искусственные нейронные сети заимствуют принципы работы головного мозга, 
это означает, что знания и процессор не разделены, а находятся в равномерно 
распределённом состоянии, неявно существуя в виде синаптических связей [7]. 


144 
Подобные знания изначально отсутствуют и приобретаются в процессе 
обучения. Нейронные сети представляют собой совокупность математических 
методов, применяемых для обработки данных, прогнозирования и 
кластеризации [8]. 
Модель нейронной сети можно разделить на три типа: 
1) сети прямого распространения (обратное распространение): 
применяется в таких областях, как прогнозирование и распознавание образов; 
2) сети с обратной связью: в основном используется для оптимизации 
вычислений и ассоциативной памяти;
3) самоорганизующиеся сети: включают модели теории адаптивного 
резонанса (АРТ) и модели Кохонена, в основном используемые для кластерного 
анализа. В настоящее время для анализа данных используется нейронные сети 
прямого распространения. Искусственные нейронные сети являются активно 
развивающейся областью науки, но до сих пор некоторые теории не были 
полностью сформированы, такие как проблемы сходимости, устойчивости, 
локального минимума и корректировки параметров. Для сети прямого 
распределения общих проблем - обучение медленное, оно может попасть в 
локальный минимум и сложно определить параметры обучения. Ввиду этих 
проблем многие перешли на метод комбинирования искусственных нейронных 
сетей с генетическими алгоритмами и достигли лучших результатов. Одним из 
основных преимуществ нейронных сетей является возможность аппрокси-
мировать любую непрерывную функцию, что позволяет исследователю заранее 
не принимать никаких гипотез о модели. К существенным недостаткам 
нейронных сетей относится тот факт, что окончательное решение зависит от 
начальных настроек сети, и его практически невозможно интерпретировать в 
традиционных аналитических терминах. 
Литература 
1. Frawley W., Piatetsky-Shapiro G., Matheus C. Knowledge Discovery in Databases: An Overview. AI 
Magazine, 1992. Р. 213-228. 
2. Паклин Н.Б., Орешков В.И. Бизнес-аналитика от данных к знаниям. СПб.: Питер ISBN, 2016. 706 
с. 
3. Макарычев П.П., Афонин А.Ю. Оперативный и интеллектуальный анализ данных: учеб. пособие. 
Пенз : Изд-во ПГУ, 2010. 156 с. 
4. Мулюкова К.В. Сравнительный анализ современных инструментов Data Mining // Молодой 
ученый, 2019. №1. С. 19-21. 
5. Романов В.П. Интеллектуальные информационные системы в экономике: Учебное пособие / Под 
ред. д. э. н., проф. Н.П. Тихомирова. М.: Издательство «Экзамен», 2003. 496 с. 
6. McCulloch W.S. and Pitts W. A logical Calculus of Ideas Immanent in Nervous Activity // Bull. 
Mathematical Biophysics, 1943. Vol. 5. P. 115–133. 
7. Ясницкий Л.Н. Введение в искусственный интеллект: Учеб. пособие для вузов. М.: Изд. центр 
«Академия», 2005. 176 с. 
8. Дебок Г., Кохонен T. Анализ финансовых данных с помощью самоорганизующихся карт: Пер. с 
англ. М.: Альпина, 2001. 317 с. 
9. Дюк В.А., Флегонтов А.В., Фомина И.К. Применение технологий интеллектуального анализа 
данных в естественнонаучных, технических и гуманитарных областях // Известия РГПУ им. А.И. 
Герцена, 2011. № 138. 

Download 4,05 Mb.

Do'stlaringiz bilan baham:
1   ...   56   57   58   59   60   61   62   63   ...   87




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2025
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish