47
Рисунок 2.7
Модель данных в виде схемы типа «снежинка»
2.2.
Информационные технологии и системы в научных исследо-
ваниях
Создание информационного
хранилища аналитических данных,
основанное на идее сбора разрозненной информации, хранящейся в
организациях, в единый массив в пригодном для анализа виде имеет
большое значение для реализации аналитических процедур в рамках
научных исследований и решения практических задач. Если еще в 80-
г. прошлого века для выполнения научных исследований неотъемле-
мой частью самого исследования была разработка компьютерных
программ, когда ученый сам ставил себе задачу, выполнял ее и был в
большинстве случаев единственным пользователем созданного при-
ложения, то в настоящее время существует широкий спектр профес-
сиональных решений, обеспечивающих
поддержку выполнения на-
учных исследований. Особое место в широком спектре аналитиче-
ских систем занимают средства бизнес-анализа. Это объясняется, с
одной стороны, острой потребностью в исследованиях под воздейст-
вием возросшего уровня конкуренции, внешних и внутренних изме-
нений в бизнесе, высокими требованиями к оперативности и обосно-
ванности принимаемых решений. С
другой стороны
наличие гро-
мадных объемов данных, накопленных в государственных, регио-
нальных, корпоративных базах данных позволяет выявить новые зна-
ния для повышения эффективности бизнеса.
Современные технологии, применяемые в
системах бизнес-
анализа, ориентированы исследовательские процессы, обеспечи-
вающие принятие обоснованных решений в управлении экономиче-
скими объектами. Предварительный анализ, как правило, выполня-
ется
средствами OLAP-технологий
технологий оперативной ана-
литической обработки данных, которые просты в применении,
снабжены инструментами визуализации данных и возможностью
выполнения необходимых расчетов.
Для выполнения глубоких ис-
следований необходимо применение более гибких методов интел-
лектуального анализа данных. В этом случае предпочтение отдается
методам
Data Mining
.
Data Mining
процесс выявления скрытых закономерностей и
взаимозависимостей в больших наборах данных для поддержки при-
48
нятия решений
8
. Основная особенность Data Mining
это сочетание
широкого математического инструментария (от классического стати-
стического анализа до новых кибернетических методов) и последних
достижений в сфере информационных технологий. В технологии Data
Mining гармонично объединились строго формализованные методы и
методы неформального анализа, т.е. количественный и качественный
анализ данных.
К методам и алгоритмам Data Mining относятся следующие: ис-
кусственные нейронные сети,
деревья решений, символьные прави-
ла, методы ближайшего соседа и k-ближайшего соседа, метод опор-
ных векторов, байесовские сети, линейная регрессия,
корреляцион-
но-регрессионный анализ; иерархические методы кластерного ана-
лиза, неиерархические методы кластерного анализа, в том числе ал-
горитмы k-средних и k-медианы; методы поиска ассоциативных
правил, в том числе алгоритм Apriori; метод ограниченного перебо-
ра, эволюционное программирование и генетические алгоритмы,
разнообразные методы визуализации
данных и множество других
методов
9
.
Большинство аналитических методов, используемые в техноло-
гии Data Mining – это известные математические алгоритмы и мето-
ды. Новым является возможность их использования не только в тео-
ретических исследованиях, но и для решения практических задач, что
обусловлено возможностями современных информационных систем
и технологий.
Выбор инструментальных средств анализа экономической ин-
формации определяется видом научного исследования, его целями и
задачами, объектом и предметом исследования. Рассмотрим отдель-
ные, наиболее распространенные решения.
Do'stlaringiz bilan baham: