Понятие Интеллектуального анализа данных (Data Mining). Data Mining как часть рынка интеллектуальных технологий
Data Mining – это анализ данных, это собирательное название для обозначения совокупности методов обнаружения в данных доступных для интерпретации, ранее неизвестных, нетривиальных и практически полезных знаний, необходимых для принятия решений.
Интеллектуальный анализ данных – это раздел информатики, изучающий процессы обработки данных с целью получения полезной информации и принятия решений. Основная польза разрабатываемых методов анализа данных заключается в некоторой предсказательной способности: проанализировав некоторый набор данных, информационная система анализа данных должна обучиться для дальнейшего распознавания или прогнозирования некоторых участков данных в ситуациях, когда часть данных утеряна или неизвестна. Кроме этого, системы анализа данных могут решать задачи редуцирования объёма данных с целью устранения избыточности, визуализации данных для их удобного восприятия человеком, моделирования новых данных по имеющимся данным и др.
Интеллектуальный анализ данных – это во многом прикладная теория, число приложений которой к реальным промышленным задачам растёт с каждым годом. В настоящее время методы и средства интеллектуального анализа данных используются при веб-разработке, в биоинформатике, в системах компьютерного зрения, в разработке компьютерных игр, в маркетинге, в медицинской диагностике, в методах оптимизации, при разработке поисковых систем, при распознавании образов, изображений, речи и сигналов и т.д. Востребованность специалистов по интеллектуальному анализу данных постоянно возрастает, как и доля финансирования разработок в этой области. Появляется всё больше программных решений для анализа данных, в том числе с открытым исходным кодом. Всё это свидетельствует о необходимости включения курса интеллектуального анализа данных в учебные программы по большинству технических специальностей, связанных с информатикой.
Модели интеллектуального анализа данных применяются для нескольких типов задач:
прогнозирование: оценка продаж, предсказание нагрузки сервера или его времени простоя;
риск и вероятность: выбор подходящих заказчиков для целевой рассылки, определение точки баланса для рискованных сценариев, назначение вероятностей по диагнозам или другим результатам;
рекомендации: определение продуктов, которые будут продаваться вместе, создание рекомендательных сообщений;
поиск последовательностей: анализ выбора заказчиков во время совершения покупок, прогнозирование их поведения;
группирование: разделение заказчиков или событий на кластеры, анализ и прогнозирование общих черт этих кластеров.
Интеллектуальный анализ данных в основном используется отраслями, обслуживающими потребителей, в том числе в сфере розничной торговли, в финансах и маркетинге.
Data Mining позволяет анализировать покупательские корзины, чтобы улучшать рекламу, создавать запасы товаров на складах и планировать, как их разложить на витринах, открывать новые магазины и выявлять потребности разных категорий клиентов.
Кредитным организациям Data Mining позволяет выявлять мошенничество с кредитными карточками путем анализа подобных транзакций, а также предлагать различные виды услуг разным группам клиентов.
Предприятиям анализ больших данных позволяет согласовывать планы поставок с прогнозами спроса, а также обнаруживать проблемы производства на ранних стадиях и успешно инвестировать. Производители могут спрогнозировать износ производственных активов и запланировать техническое обслуживание и ремонт, чтобы не останавливать линию выпуска продукции.
Do'stlaringiz bilan baham: |