Вопросы для самопроверки 42
Литература к главе 2 42
ГЛАВА 3. ИНТЕЛЛЕКТУАЛЬНЫЕ МЕТОДЫ ИЗВЛЕЧЕНИЯ ЗНАНИЙ 43
3.1. Деревья решений 43
3.2. Ассоциативные правила 46
3.3. Нейронные сети 53
3.4. Генетические алгоритмы 59
3.5. Машинное обучение на основе механизмов индуктивного вывода 68
Вопросы для самопроверки 72
Литература к главе 3 72
ГЛАВА 4. ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА И ОБРАБОТКИ ДАННЫХ 74
4.1. Общая характеристика инструментальных средств 74
4.2. Инструментальное средство MineSet 82
4.3. Инструментальное средство Intelligent Miner 85
4.4. Инструментальное средство IDIS 90
4.5. Семейство инструментальных средств фирмы Cognos 97
4.6. Области применения и пути развития технологии интеллектуального анализа и обработки данных 107
Вопросы для самопроверки 117
Литература к главе 4 118
ПРЕДИСЛОВИЕ
Одна из фундаментальных проблем современных систем поддержки принятия решений состоит в получении значимой информации из огромного постоянно увеличивающегося объема данных, содержащегося в базах данных (БД).
Большинство международных организаций производят за неделю большее количество информации, чем многие люди могли бы прочитать за всю жизнь. Ещё более тревожная ситуация во всемирных сетях, подобных Internet. Каждый день во всем мире распределяются сотни мегабайт данных, но хуже всего, что этим процессом невозможно управлять - рост имеет экспоненциальный характер. Мы сталкиваемся с новым парадоксом роста данных: больше данных означает меньше информации. Механическое производство и воспроизводство данных вынуждает развивать новую технологию отбора, фильтрации, выделения и обработки данных - технологию интеллектуального анализа и обработки данных (ИАОД).
В начале 90-х годов стало очевидно, что помимо транзакционной обработки данных, осуществляемой традиционными системами оперативной обработки (OLTP), необходима аналитическая и концептуальная обработка накопленных данных. Работникам управления приходится принимать решения не только в условиях неполной, но и зачастую недостоверной и противоречивой информации. К тому же не всегда удается получить требуемую информацию вовремя и в наглядном виде, что приводит к неудачным решениям. Чтобы вырваться из этого затруднительного положения, была предложена технология хранилищ данных (Data Warehouse). Хранилище данных предлагает такую среду накопления данных, которая оптимизирована для выполнения сложных аналитических запросов управленческого персонала. В ее задачу входит автоматический сбор операционных данных, их согласование и объединение в предметно-ориентированный формат, который нужен работникам управления.
Развитие технологии хранилищ данных стимулировало широкое развитие средств извлечения знаний, позволяющих преобразовывать различные выборки данных из операционных баз данных в знания. Если ранее необходимо было сначала собрать данные, проверить и объединить их, то сегодня это уже сделано - данные находятся в информационных хранилищах и дело лишь за тем, чтобы наиболее рационально ими воспользоваться.
С точки зрения пользователя в процессе извлечения знаний из БД должны решаться следующие задачи преобразования: данных (т.е. неструктурированных наборов чисел и символов) в информацию (т.е. описание обнаруженных закономерностей); информации в знания (значимые для пользователя закономерности); знаний в решения (последовательность шагов, направленная на достижение информационных потребностей пользователя).
При написании данного учебного пособия авторы стремились систематически изложить основные методы интеллектуальной обработки данных и методологию построения этого нового класса систем и таким образом подготовить читателя к самостоятельной работе в этой области.
Учебное пособие состоит из четырех глав. Первая глава вводит читателя в проблематику систем интеллектуального анализа и обработки данных (ИАОД). Вторая и третья главы посвящены центральным вопросам, рассматриваемым при создании ИАОД: описанию методов извлечения знаний из данных. Во второй главе рассматриваются традиционные методы; в третьей - интеллектуальные (такие как методы инженерии знаний, нейросетевые и методы эволюционного моделирования).
В четвертой главе рассмотрены некоторые инструментальные комплексы для создания ИАОД, признанные специалистами в числе лучших в своем классе (MineSet, Intelligent Miner, IDIS, Scenario и 4Thought).
Do'stlaringiz bilan baham: |