52
проблемах понимания, может ли он
помогать в переформулировке
неберущихся запросов и т.д.
2.2.3. Критерии стоимости построения и сопровождения ЕЯ-
интерфейса
Вышеперечисленные характеристики входят в оценки качества
ЕЯ-интерфейса. Важным критерием при сравнении ЕЯ-интерфейсов
является также трудоемкость его создания, то есть необходимое
количество усилий (времени), требуемых для его построения. Ранние
ЕЯ-интерфейсы создавались для
каждой базы данных отдельно, и,
разумеется, их стоимость была очень большой. Все эти системы были
экспериментальными. Усугубляло проблему также то, что до конца 70-
х годов не было единого универсального формального языка запросов
к базам данных. Ранние системы понимания ЕЯ-запросов к СУБД были
непортируемыми на другие базы данных, и зачастую лингвистическое
ядро не отделялось от предметно-ориентированных настроек.
Современные
промышленные
системы
построения
ЕЯ-
интерфейсов обладают достаточно высокой степенью портируемости,
что, безусловно, снижает стоимость построения ЕЯ-интерфейса.
Лингвистическое ядро является универсальным элементом, словарь
содержит универсальную лексику,
используемую во многих ЕЯ-
интерфейсах, модели предметной области могут содержать шаблоны,
общие для нескольких предметных областей и т.д. Зачастую
используется метафора "фабрики и изделия", изделием выступает ЕЯ-
интерфейс, который собирается из готовых компонентов, которые
настраиваются под конкретную базу данных.
Следует отметить, однако, что вопрос
портирования на другие
языки является открытым. Подавляющее большинство исследований
проведено для английского языка, некоторые особенности которого
изначально заложили в пути исследований мину замедленного
действия - первоначально огромное количество усилий были
потрачены на анализ синтаксиса.
Сейчас можно сказать, что эти
усилия не оправдали себя.
На
трудоемкость
создания
ЕЯ-интерфейса
влияет
также
необходимая квалификация настройщика ЕЯ-интерфейса. Для систем,
требующих навыков лингвиста, трудоемкость построения ЕЯ-
интерфейса больше, чем для систем, где
для построения интерфейса
требуется просто описать предметную область по некоторым
предопределенным шаблонам и отобразить ее на схему базы данных,
и дело здесь не только в стоимости труда лингвиста и инженера
знаний или специалиста в области баз данных. Системы, требующие
подстроек на уровне лингвистического ядра, являются более гибкими,
поскольку позволяют разрешать проблемы понимания ЕЯ-запросов
написанием
соответствующих
"заплаток",
однако
работы
по
написанию таких "заплаток"
являются настолько сложными, требуют
53
такого уровня понимания принципов машинного анализа ЕЯ в целом,
что настройка ЕЯ-интерфейса на уровне лингвистического процессора
зачастую возможна только авторами системы построения ЕЯ-
интерфейса. Впрочем, сложность подстройки ядра очень сильно
зависит от принципов анализа,
используемого при написании
инструментария, открытости ядра и т.д.
Do'stlaringiz bilan baham: