Основная часть. В качестве объекта статьи мы решили проанализировать опыт разработки системы создания словарей в компании ABBYY. На сегодняшний день ABBYY и ABBYY Publishing создали более 40 словарей силами своих лексикографов или в сотрудничестве с профессиональными лексикографическими сообществами. Большинство публикуемых словарей одновременно издаются в электронном, бумажном, мобильном и онлайн-изданиях. Для создания и редактирования словарей используется профессиональная лексикографическая система. Это контент ABBYY Lingvo, система, которая внутренне изменяется и постоянно пополняется новыми функциями.
Анализ этих словарных проектов показывает, что существует цепочка связей между различными звеньями и областями лексикографического процесса:
1) технологические разработки и меняющиеся запросы пользователей словарей влияют на издание словарей;
2) работа лексикографа варьируется в зависимости от формата публикации;
3) Потребности лексикографов влияют на развитие систем создания словарей.
Формирование этой цепочки связей мы видим на примере редактирования большого англо-русского словаря, созданного командой лексикографов ABBYY, и подготовки этого словаря для второго бумажного издания в ABBYY Press. Во-первых, мы определяем особенности и ограничения каждого формата, в котором публикуется словарь. Гибкость словаря для разных изданий включает публикацию в виде книги, краткое изложение, использование сокращений (символов), вложенность статей, размещение фраз и идиом в основных статьях с ключевым словом, широкое использование цитат.
При публикации в виде электронного словаря на первый план выходят критерии простоты поиска словарной статьи и использования словаря при работе на компьютере (чтение документов, написание писем, просмотр веб-адресов). Электронный словарь призван как можно скорее предоставить пользователю всю необходимую информацию о слове. Важный упор делается на адаптацию словарного материала и выполнение быстрого поиска для задач электронного словаря, а также на предоставление пользователю максимальной информации о слове. Что еще более важно, следует отличать основные черты слова от второстепенных. Эти особенности электронного словаря также влияют на представление словарного материала лексикографом: заголовки словарных статей в таком словаре (если словарь не имеет функции морфологического анализа) включают устойчивые фразы и т. д.
Словарь позволяет пользователю быстро найти перевод / толкование фразы, использованной в тексте, из электронного словаря. При использовании электронного словаря важно обращать внимание на то, о каком слове во фразе пользователю нужна информация (словарная статья для слова, которое он должен выбрать для просмотра). Лексика электронного словаря также имеет устойчивое отношение к словам - картотека может содержать разные формы слова, в зависимости от исходной формы или перевода, что также обеспечивает быстрый поиск.
Создание словаря. Электронный словарь ABBYY Lingvo имеет внутренний морфологический модуль, позволяющий автоматически определять начальную форму слова. При работе со словарем пользователь просматривает слово, которое не в исходной форме, и ссылается на словарную статью с исходной формой слова. Наличие морфологического модуля позволяет лексикографу «не путать» словарь со словами и упростить поиск по всем словам в словаре. Морфологический модуль играет еще одну важную роль в электронном словаре: он предоставляет пользователю информацию обо всех формах слова. Это особенно актуально для языковых требований, богатых неправильными глаголами, незначительным изменением и другими примерами. Для работы с электронным словарем Lingvo пользователь может в любой момент увидеть карточку, прикрепленную к каждой статье в словаре, название карточки включает все формы.
Работа с устойчивыми выражениями и фразами. В то время как стабильные комбинации и фразы в бумажном словаре обычно включаются в статью словаря ключевых слов со ссылками, в электронных словарях они зачастую конвертируются в отдельные словари, чтобы сохранить поисковый запрос пользователя. В электронных словарях не возникает проблем с экономией места - словарная статья легко расширяется, а количество статей не ограничено. Эта ситуация дает лексикографу некоторую свободу: она не позволяет ему выйти за рамки чисто лингвистических ограничений. Проблема словарных статей остается актуальной при описании устойчивых соединений и словосочетаний в электронном словаре. Эта проблема была решена при редактировании большого англо-русского словаря: в системе создания словарей лексикограф ссылался на устойчивые выражения и словосочетания в статье. Однако фразы и устойчивые комбинации представлены в виде отдельных словарных статей, а в словаре есть автономные статьи. Кроме того, лексикограф поставил специальную отметку в словаре для таких статей (идиом и устойчивых выражений), которые не будут включены в бумажное издание. В отдельных карточках слов, представляющих словосочетания, лексикограф дал подробное описание каждой идиомы при разработке отдельной словарной статьи. Однако в статьях, где присутствуют ключевые слова, слово не содержит этой информации - только ссылку на устойчивое выражение. Позже разработчики словарей столкнулись с рядом проблем:
а) «обучение» системе отличать словарные статьи от других словарных статей со стабильными связями и идиомами. С этой целью лексикограф добавил в словарь специальный символ - поместил его перед описанием фраз в словаре и описанием устойчивых выражений.
б) Поддержание связи между ключевым словом и отдельными словарными фразами статьи было достигнуто посредством коммуникационных ссылок.
в) разработать алгоритм экспорта данных из системы для создания словарей разных форматов, чтобы статья помещалась в статью со словарными идиомами и фразами, а в электронном словаре они становились отдельными словарными карточками. Для экспорта и публикации данных был разработан следующий алгоритм обработки данных. Он действует при экспорте словаря в электронном или бумажном формате:
1) названия коллоквиумов не включаются в бумажный словарь (потому что лексикограф ставит соответствующую отметку), но отображается в электронном словаре и может быть найдено в поиске электронного словаря;
2) при издании бумажного словаря, если словарная статья содержит ссылки на названия этих карточек, автоматически расширяется содержание карточек со стабильными связями в статье;
3) В случае электронной публикации ссылка в статье остается в виде ссылки на слово.
Ниже приводится пример устойчивого выражения candid friend в электронном словаре:
В заключении следует отметить, что опыт ABBYY Ling может быть эффективно использован при создании электронных словарей узбекского языка. Пополнить узбекскую национальную лексикографию можно на основе общих лексикографических принципов и методов.
ИСПОЛЬЗУЕМЫЕ ИСТОЧНИКИ:
https://www.google.com/search?q=ABBYY+lingvo&oq=ABBYY+lingvo+&aqs=chrome..69i57j0i512j0i67j0i512l7.699j0j15&sourceid=chrome&ie=UTF-8#
https://www.lingvo.ru/
https://play.google.com/store/apps/details?id=com.abbyy.mobile.lingvo.market&hl=ru&gl=US
Do'stlaringiz bilan baham: |