3.5. Машинное обучение на основе механизмов индуктивного вывода
Задачу машинного обучения можно определить, как эвристический поиск в пространстве символических описаний, созданных применением определенных правил к первоначальным предположениям. Правила вывода включают правила обобщения, которые выполняют обобщающие преобразования описаний, и сохраняющие истину дедуктивные правила.
Машинное обучение может носить как конструктивный (получение описания новых понятий), так и селективный (получение описания обобщений, абстракций) характер. Оно включает следующие подходы:
- обучение посредством открытия;
- концептуальное индуктивное обучение;
- обучение по аналогии.
В основу подходов положена следующая идея. На основании имеющихся фактов и знаний о предметной области проводится операция порождения некоторой новой информации (эвристики); удовлетворительные с точки зрения принятых заранее и, возможно, изменяющихся оценок эвристики вносятся в базу знаний и считаются результатом процесса машинного обучения.
Разница между подходами состоит в применяемой операции порождения нового знания. В индуктивном обучении это - операция индуктивного обобщения; в обучении по аналогии - некоторое (порождаемое) отображение из известной области знания в исследуемую область; при обучении посредством открытия - операция получения новых знаний определяется исходными данными и знаниями.
При обучении посредством открытия получение описания новых знаний не ограничено конкретной операцией. Предполагается следующая процедура.
Известны некоторые знания о предметной области: не только факты, возможно, более сложные структурные образования.
Путем порождения новых гипотез (как правило, это "мутационная" модификация известных знаний) и оценки их с точки зрения некоторого критерия предпочтения, можно автоматически получить новые "полезные" знания.
В силу более сложного соответствия между данными и результатом, метод оказывается труден для использования (проще с числовыми данными). Но при достижении удовлетворительных результатов возможно эффективное практическое приложение.
Индуктивное обучение есть процесс получения знаний путем выполнения индуктивного вывода из фактов, предоставляемых учителем или окружением. Такой процесс включает операции обобщения, преобразования, исправления и очищения представления знаний. Концептуальное индуктивное обучение подразумевает получение описания новых знаний (обобщений), удобного для семантической интерпретации конечным пользователем.
Два способа концептуального индуктивного обучения различаются по способу получения информации об исходных данных. Обучение по примерам использует "учителя", обучение по наблюдениям имеет дело только с описанием исследуемой области и, возможно, контекстом, что близко к задаче кластерного анализа.
При обучении по примерам получение описания классов объектов происходит путем обобщения даваемых учителем примеров и контр примеров объектов из этих классов.
Постановка задачи такова.
Даны объекты (обучающая выборка), описываемые значениями атрибутов (точки в пространстве признаков); над ними проведена операция классификации (учителем); заданы также некоторые априорные знания о проблемной области (семантические ограничения, правила модификации, критерий предпочтения).
Необходимо найти удовлетворительные с точки зрения знаний о проблемной области и семантической интерпретации описания классов объектов.
При обучении по наблюдениям (концептуальной кластеризации) описания классов объектов происходит путем экспериментирования, обнаружения регулярностей, формулировки полезных понятий и структурных заключений относительно объектов.
Постановка задачи такова.
Дано множество фактов, объектов, явлений; множество атрибутов, описывающих это явление; некоторое априорное знание о предметной области (семантические ограничения, правила модификации, критерий предпочтения и т.п.).
Необходимо найти непротиворечивую иерархию классов (нижние в иерархии - сами факты), описания которых обеспечивает эффективную интерпретацию. Часто описание предметной области с помощью символьной информации делает это описание и последующее решение задачи машинного обучения очень сложной. В такой ситуации предлагается использовать количественные, статистические или теоретико-информационные, характеристики предметной области, что позволяет существенно упростить решение задачи обучения при больших массивах исходных данных, а также при отсутствии явного критерия предпочтения. В силу последнего обстоятельства такой подход получил широкое распространение, т.к. позволяет создавать универсальные методы, применимые в различных предметных областях. В частности, такой подход характерен для алгоритмов, основанных на построении деревьев решений (см. раздел 3.1).
Обучение по аналогиям - это получение описания классов объектов путем модификации описания, уже полученного для аналогичного класса объектов.
Постановка задачи такова.
Дан "источник" аналогии - известные знания о некоторых объектах и их взаимосвязях; предметная область (с начальным описанием), знания о которой нужно получить;
Необходимо найти отображение из "источника" в целевую область искомых знаний и описать результаты отображения.
Do'stlaringiz bilan baham: |