Проблемная
среда
|
Наблюдаема я полностью или частично
|
Детерминиро ванная,стратегическая или стохастическая
|
Эпизодическая или последовательная
|
Статическая, динамическая или полудинами- ческая
|
Дискретная или непрерывная
|
Одноагентная или мультиа- гентная
|
Решение
кроссворда
|
Полностью
наблю
даемая
|
Детерми
нированная
|
Последова
тельная
|
Статическая
|
Дискретная
|
Одноагент
ная
|
Игра в шах маты с контролем времени
|
Полностью наблю даемая
|
Стохастическая
|
Последова тельная
|
Полудинамическая
|
Дискретная
|
Мульти-агентная
|
Игра в покер
|
Частично
наблю
даемая
|
Стохасти
ческая
|
Последова
тельная
|
Статическая
|
Дискретная
|
Мульти-
агентная
|
Игра в нарды
|
Полностью
наблю
даемая
|
Стохасти
ческая
|
Последова
тельная
|
Статическая
|
Дискретная
|
Мульти- агентная
|
Вождение
такси
|
Частично
наблю
даемая
|
Стохасти
ческая
|
Последова
тельная
|
Динами
ческая
|
Непрерыв
ная
|
Мульти-
агентная
|
Медицинская
|
Частично
|
Стохасти
|
Последова
|
Динами
|
Непрерыв
|
Одноагент
|
диагностика
|
наблю
даемая
|
ческая
|
тельная
|
ческая
|
ная
|
ная
|
Анализ
изображений
|
Полностью
наблю
даемая
|
Детерми
нированная
|
Эпизоди
ческая
|
Полудина-
мическая
|
Непрерыв
ная
|
Одноагент
ная
|
Робот-
сортировщик
деталей
|
Частично
наблю
даемая
|
Стохасти
ческая
|
Эпизоди
ческая
|
Динами
ческая
|
Непрерыв
ная
|
Одноагент
ная
|
Контроллер
очистительной
установки
|
Частично
наблю
даемая
|
Стохасти
ческая
|
Последова
тельная
|
Динами
ческая
|
Непрерыв
ная
|
Одноагент
ная
|
Интерактив
ная программа, обучающая английскому языку
|
Частично
наблю
даемая
|
Стохасти
ческая
|
Последова
тельная
|
Динами
ческая
|
Дискретная
агентная
|
Мульти-агентная
|
|
Структура агентов
До сих пор в этой книге свойства агентов рассматривались на основании анализа их поведения — действий, выполняемых агентом после получения любой заданной последовательности актов восприятия. Теперь нам поневоле придется сменить тему и перейти к описанию того, как организовано их внутреннее функционирование. Задача искусственного интеллекта состоит в разработке программы агента, которая реализует функцию агента, отображая восприятия на действия. Предполагается, что эта программа должна работать в своего рода вычислительном устройстве с физическими датчиками и исполнительными механизмами; в целом эти компоненты именуются в данной книге архитектурой, а структура агента условно обозначается следующей формулой:
Агент = Архитектура + Программа
Очевидно, что выбранная программа должна быть подходящей для этой архитектуры. Например, если в программе осуществляется выработка рекомендаций по выполнению таких действий, как Walk (ходьба), то в архитектуре целесообразно предусмотреть использование опорно-двигательного аппарата. Архитектура может представлять собой обычный персональный компьютер или может быть воплощена в виде роботизированного автомобиля с несколькими бортовыми компьютерами, видеокамерами и другими датчиками. Вообще говоря, архитектура обеспечивает передачу в программу результатов восприятия, полученных от датчиков, выполнение программы и передачу исполнительным механизмам вариантов действий, выбранных программой, по мере их выработки.
Простые рефлексные агенты
Простейшим видом агента является простой рефлексный агент. Подобные агенты выбирают действия на основе текущего акта восприятия, игнорируя всю остальную историю актов восприятия. Например, агент-пылесос, для которого результаты табуляции функции агента приведены в табл. 1.1, представляет собой простой рефлексный агент, поскольку его решения основаны только на информации о текущем местонахождении и о том, содержит ли оно мусор. Программа для данного агента приведена в листинге 1.2.
Листинг 2.2. Программа простого рефлексного агента в среде пылесоса с двумя состояниями. Эта программа реализует функцию агента, которая табулирована в табл. 2.1
function Reflex-Vacuum-Agent([location,status]) returns действие action
if status = Dirty then return Suck
else if location = A then return Right
else if location = В then return Left
Обратите внимание на то, что эта программа агента-пылесоса действительно очень мала по сравнению с соответствующей таблицей. Наиболее очевидное сокращение обусловлено тем, что в ней игнорируется история актов восприятия, в результате чего количество возможных вариантов сокращается от 4Т просто до 4. Дополнительное небольшое сокращение обусловлено тем фактом, что если в текущем квадрате имеется мусор, то выполняемое при этом действие не зависит от местонахождения пылесоса.
Рис. 1.3. Схематическое изображение структуры простого рефлексного агента
Do'stlaringiz bilan baham: |