329 Теоретические аспекты извлечения знаний.
Основной проблемой инженерии знаний является процесс извлечения знаний, значит, необходимо четко понимать природу и особенности этих процессов. Выделим три основных аспекта этой процедуры: психологический, лингвистический, гносеологический.
Классификация методов извлечения знаний:
Коммуникативные методы
Пассивные методы
Наблюдения
Анализ протоколов "мыслей вслух"
Лекции
Активные индивидуальные
Анкетирование
Интервью
Свободный диалог
Экспертные игры
Активные групповые методы
"Круглый стол"
"Мозговой штурм"
Ролевые игры
Текстологические методы
Анализ учебников
Анализ литературы
Анализ документов
330 Теория нормальных форм. Нормализации
В реляционной базе данных схема содержит как структурную, так и семантическую информацию. Структурная информация связана с определением схемы отношения, а семантическая выражается множеством известных функциональных зависимостей между атрибутами. Некоторые функциональные зависимости являются нежелательными из-за побочных эффектов, которые они вызывают при модификации БД. В связи с этим возникает вопрос о корректности схем. Корректной считается схема, в которой отсутствуют нежелательные функциональные зависимости между атрибутами. Для устранения нежелательных функциональных зависимостей прибегают к процедуре декомпозиции, при которой исходное множество схем отношений заменяется другим, являющимся проекциями первых. Эта процедура называется нормализацией.
Нормализация - это пошаговый обратимый процесс замены данной схемы (или совокупности схем отношений) другой схемой, в которой отношения имеют более простую структуру. При этом возникает проблема обратимости, т.е. возможности восстановления исходной схемы.
Исходными данными для проектирования является представление предметной области в виде одного или нескольких отношений. На каждом шаге проектирования определяется некоторый набор схем отношений, обладающих лучшими свойствами по сравнению с исходным. Процесс проектирования представляет собой процесс нормализации схем отношений, причем каждая следующая нормальная форма обладает свойствами лучшими, чем предыдущая. В теории нормальных форм определены нормальные формы, которые ограничивают типы допустимых зависимостей.
Каждой нормальной форме соответствует некоторый определенный набор ограничений, и отношение находится в некоторой нормальной форме, если удовлетворяет этому набору ограничений.
Основные свойства нормальных форм:
каждая следующая нормальная форма в некотором смысле лучше предыдущей;
при переходе к следующей нормальной форме свойства предыдущих нормальных свойств сохраняются.
В основе процесса проектирования лежит метод нормализации, декомпозиция отношения, находящегося в предыдущей нормальной форме, в два или более отношения, удовлетворяющих требованиям следующей нормальной формы.
Конечная цель декомпозиции: каждая схема отношения реляционной базы данных должна состоять из первичного ключа и множества взаимно независимых атрибутов, описывающих объект.
В процессе нормализации присходит замена одного набора схем отношений другим, получаемым с помощью декомозиции исходного набора. Замена должна быть эквивалентной, т.е. гарантирующая отсутствие потерь данных и сохраняющая все зависимости исходных схем.
Сохранение зависимостей означает выполнение исходного множества функциональных зависимостей на отношениях новой схемы.
Декомпозиция без потерь означает, что при обратном соединении проекций мы получим исходное отношение. Т.е. исходное отношение равно соединению его проекций (имеется в виду естественное соединение, по общим атрибутам).
Do'stlaringiz bilan baham: |