Контрольние вопросм к теме 9
Назовите осн овн ье функции и сф ерь при м енения терм инологических словарей.
От чего зависит об ъем информации терм инологического словаря?
Какими правилами ру ководству ются лексикогра ф ь при формулировке толкований терминов?
ТЕМА 10
Компьютерная лек сик ограф ия
Лексикография - один из самьх трудоемких видов лингвистической деятельности. Поэтому не случайно перв ье достиж ения по автоматизации лингвистических работ бьли связань именно с созданием электронньх словарей.
Любой бумажньй словарь с т очки зрен ия пользователя имеет два сушественньх недостатка : во-первьх, он неизбежно отстает от язьков ьх
изменений. Во-втормх, традиционнье словари не могут
обеспечить бьтстрьш поиск по различньш критериям, поскольку их словарнме статьи имеют жестко заданную структуру. К тому же, традиционнье словари вьнуждень ограничивать об ъем информации, поскольку лексикограф ь вьнуждень помнить об экономии пространства.
Поэтому современньй пользователь охотно обраш,ается к элект рон н ьм словарям ра зличн ьх типов. Разработкой таких словарей занимается особое направление лексикографии - компьютерная лексикография.
Для создания слова рей использу ются специа льн ье программь - базь данньх, электроннье ка ртотеки, корпу са т екст ов и др. Все множ ество компьютерньх лексикогра ф ических програ м м мож но у словн о разделить на две больших гру ппь :
программъг поддержки лексикографических работ;
автоматические словари различнъгх тпипов (сюда же относятся лексикогра ф ические базь данньх).
Как использу ются компьютернье программь поддерж ки лексикографических работ ? В самом обш,ем виде этот процесс проходит н есколько этапов. Вначале формиру ются лексикогра ф ические базь данньх, на основе кот орьх затем ст роят ся словарнье ста тьи. В базе данньх создаются записи, кот орье впоследствии вьполняют фу нкции традиционньх бумажньх ка рточек с той т олько разницей, что запи си базь данньх позволяют а втоматически сортировать массив по ра зличн ьм па раметрам, отбирать нужнье прим ерь , объединять их в гру ппь и т.д. Та ким образом, лексикогра ф ические базь данньх фиксиру ют материал, из кот орого пот ом бу дет строиться словарь.
Еш,е один важньш этап создания электронного словаря - это подбор прим еров, кот орье долж нь достаточно полн о иллюстрировать возмож ности у потребления слова в речи . Подбор прим еров в словарях, кот орье создаются при пом оши компьютера, значительно отлича ется от той работь , котору ю приход илось вьполнять составителям бумажньх словарей. Вьб ор прим ера осу ш ествляется на базе корпу сов текстов, кот орье хранятся в памяти ком пью т ера . Вьб ор происходит в а втоматическом реж име. Поиск прим еров на у потребление слова назьвается пост роением к онк орда нсов.
П осле под б ора материала начинается составление слова рн ьх статей, но дела ется это не в текстовом ред а кт оре, а в базе данньх. Та кой реж им работь сушественно у проша ет систему от сьлок, сортировку, систему у казателей, к тому же времени на создание словарньх статей в а втоматическом режиме уходит гора зд о меньш е.
Последний этап создания словаря - это формирование текста словаря, создание оригинал-макета книги. При этом поля записи базь данньх а втоматически преобразу ются в привьчнье для нас зонь словарной статьи с соответствуюшим ш рифтовьм оформлением.
Что касается соб ствен н о автоматических слова рей и лексикографи-ческих баз данньк, то первье электроннье словари появились вместе с первьми системами автоматического перевода - это бьли базь данньх по двум язька м, причем каж дая система машинного перевода имела свой собственньй словарь, составленньй для тех текстов, кот орье перевод ились данной програ м м ой. Словарь бьл яд ром любой програ ммь машинного перевода, в кот орой бьла залож ена стратегия прямого перевода. Программа обраш,алась к словарю, чтобь на вьходе вьдать пользователю переводной экви валент. Сегодня электроннье словари использу ются как составнье ча сти многих прилож ений, направленньх на обработку естественного язька : в информационно- поисковьх системах, программах а втоматического перевода, системах распозна вания и синтеза речи. Помимо эт ого, многие традиционнье словари сегод н я имеют электроннье аналоги. Самьм известньм реализованньм проект ом яв ляет ся издание Oxford English Dictionary (12 томов на одном ком па кт-д иске) и New Oxford English Dictionary. Электроннье версии позволяют пользователю осушрствлять бмстршй поиск по разньм параметрам.
Создатели электронньх версий бумажньх словарей столкнулись с ряд ом проб лем. Во-первьх, необходимо бьло стандартизировать пометь и сокраш,ения. Оказалось, что в бумажньк версиях словарей лексикографь допускали ра зличн ье варианть написания одних и тех же пом ет и сокра шен ий. В резу льтате компьютер оказьвался неспособньм к поиску инф орма ции в условиях вариативности.
Следуюшая проб лем а сост ояла в том, чтобь сдела ть дефиниции однотипньх понятий стандартньми. Это нуж но для т ого, чтобь при
необходимости пользователь мог полу чить названия и дефиниции всех та ких понятий по одному за просу (н а прим ер, если сист ем а полу ча ет за прос «речн а я рьба», то ответом мож ет бьть список всех речн ьх рьб из словаря). Для реш ения этой проб лем ь бьли испробовань ра зличн ье технологии, на пример, создание тезау ру сов или перекрестньх ссьлок в базе данньх.
Еше одна проблема, с кот орой приш лось столкну ться первьм создателям электронньх вариантов традиционньх словарей, заключалась в том, что при формировании т ипогра ф ского макета словаря приш лось игн орирова ть те приемь , кот орье использу ются в печатном д еле, а вместо них использовать логические огра н ичит ели полей в ба зах данньх. Сегод н я эта проб лем а практически реш ена, поскольку новье словари изначально создаются как базь данньх, а уже на их основе ф ормиру ются типографские ма кеть словарей.
Та ким образом, перев од в машинную форму ранее опубликованньх книжньх словарей позволяет «разлож ить по полочка м» содерж имое каж дого из них. Только так мож но осушествить эффективньй контроль полноть и последовательности за полнения полей в ста тьях словаря, а такж е эф ф екти вно использовать и контролировать информацию в
53
послед!уюш,ей лексикографической работе над новьши версиями
данного слова ря.
Примером подобного рода развиваюш,ейся лексикографической бази даннь1х может служкить «Словарь русского язьжа» С.И. Ожегова (под ред а кцией Н.Ю . Ш ведовой; в послед н их изда н иях в соа вторстве с н ей). Эта база создана в Институте ру сского язька РАН в 1990 году, и с тех пор она постоян н о пополн яет ся, на ее осн ове переиздаются обн овляемье версии эт ого словаря, а также проводятся лексикологические исслед ова н ия
Do'stlaringiz bilan baham: |