Вестник магистратуры. 2020. № 5-2 (104)
ISSN 2223-4047
__________________________________________________________________________________
86
УДК 811.161
М.Ж. Насимова, М.Н. Гайбуллаева
ОСНОВНЫЕ ПРОБЛЕМЫ АВТОМАТИЧЕСКОГО СЕМАНТИЧЕСКОГО АНАЛИЗА
В данной статье речь идёт об основныч проблемах автоматиче-
ского семантического анализа.
Ключевые слова:
алгоритм, синтаксический анализ, коммуника-
ция, синтактика, прагматика, семантика.
Современная технология все больше базируется на семантически-ориентированном подходе. Тес-
ная связь синтаксиса с семантикой не дает возможности создать эффективные системы и алгоритмы син-
таксического анализа в отрыве от смысла высказывания и текста в целом. Представление о том, что фор-
мальный подход, базирующийся либо на анализе сверху вниз (от вершины предложения к его частям) или
снизу вверх (от непосредственно составляющих низшего уровня до вершины предложения), даст возмож-
ность посредством сложения результатов получить полную и верную картину синтактико-семантических
связей предложения, отвергается современными специалистами по компьютерной лингвистике.
Автоматический семантический анализ является одной из актуальных и вместе с тем наиболее
сложной задачей компьютерной лингвистики. Нет необходимости доказывать, что он является необходи-
мым этапом создания любой системы, моделирующей человеческий интеллект. Разработки проблем авто-
матического семантического анализа велись достаточно давно, однако каких-либо установившихся мето-
дов и приемов не было найдено.
Можно утверждать, что имеющиеся решения практически пригодны
только для ограниченных областей. В рамках конкретной предметной области можно выявить основной
состав смысловых категорий, которые можно в исходном массиве текстов выделять автоматически. По-
иски же универсальных путей автоматического анализа семантического содержания текстов пока не увен-
чались успехом, хотя работы в этом направлении ведутся. В самом начале исследований и разработок по
машинному переводу были попытки придумать универсальные языки смысла, перевод
на которые и с ко-
торых позволил бы сократить число бинарных алгоритмов. Выдвигались различные идеи организации та-
ких универсальных языков. Однако ни одной действующей системы машинного перевода не было создано
на основе универсальных языков смысла. Обозначим некоторые принципиальные моменты, связанные с
поставленными нами проблемами анализа на пути «слово-словосочетание-текст». Под автоматическим се-
мантическим анализом понимается совокупность методов и приемов, с помощью которых можно путем
строгой и однозначной формальной процедуры, реализуемой на компьютере посредством специально раз-
работанных лингвистических алгоритмов, с достаточной точностью представить смысл произвольного вы-
сказывания на естественном языке в виде последовательности символов,
образующих некоторую фор-
мальную систему. Очевидно, что если были бы найдены удобные способы
изображать в языке смысла
любое произвольное высказывание на естественном языке, то вся остальная проблематика компьютерной
лингвистики свелась бы к оптимальному кодированию, а в теоретическом плане, возможно, была бы ре-
шена проблема моделирования человеческого мышления. Однако формализация семантики, являющаяся
необходимой предпосылкой такого умения выражать смысл, представляет собой крайне трудную задачу.
Принципиальная сложность проблемы состоит в том, что при изучении содержания (смысла) приходится
выходить за пределы языка и обращаться к внешнему миру, к классификации предметов и представлений,
лежащих вне сферы языка. Исследования в области формализации семантики, имеющие отношение к ком-
пьютерной лингвистике, можно условно разделить на два направления. Первое направление включает в
себя исследования, ведущиеся на дедуктивном абстрактно-теоретическом уровне и имеющие целью уста-
новить место семантики в рамках более общей науки о знаковых системах — семиотики и определить
отношения между семантикой и другими составляющими семиотики — синтактикой и прагматикой, по-
строить модели человеческого мышления самого по себе и в связи с процессом коммуникации; вывести
универсальные закономерности образования понятий, связей между значениями слов и внутри высказы-
вания между его составляющими; сформулировать и разрешить на уровне абстракции другие проблемы,
относящиеся к человеческому мышлению и особенно к языковой деятельности человека в связи с мышле-
нием и коммуникацией. Второе направление носит индуктивный, эмпирический характер. Оно ставит це-
лью решение конкретных прикладных проблем, связанных с формализацией семантики, точнее, смысла в
языковых выражениях, — проблем машинного перевода, автоматического информационного поиска, при-
кладных систем искусственного интеллекта. В рамках этого направления чаще всего рассматривается кон-
кретная предметная область, система понятий в ограниченной области знания. Область формализации в
© Насимова М.Ж., Гайбуллаева М.Н., 2020.