ции преподавания на этой основе иностранных языков интенсивно
ведутся и в
других странах, особенно в Англии (Дж. Лич).
Машинные лингвистические информационные базы накапли-
вают инвентарь сведений, пригодных для решения разного рода за-
дач автоматической переработки научной и научно-технической
информации —для автоматического поиска информации и реше-
ния других библиографических задач, для автоматического рефе-
рирования и индексирования.
Автоматический поиск библиографической информации пред-
ставляется наиболее перспективным направлением применения
ЭВМ в связи с лингвистикой, без него современному ученому все
труднее и труднее справляться с обрушивающимся на него пото-
ком информации.
Искусственный язык, предназначенный для записи семантиче-
ской информации и последующего использования ее в информа-
ционно-поисковых системах, называется информационно-поиско-
вым языком. Словарь, специально организованный для сопостав-
ления естественного и информационно-поискового языка, называ-
ется информационно-поисковым тезаурусом. Тезаурус содержит
список дескрипторов, т.е. лексических единиц информационно-по-
искового языка. Дескриптор соответствует группе ключевых слов
естественного языка. Группе синонимов соответствует один де-
скриптор, а многозначному слову — группа дескрипторов.
Процедура составления информационно-поискового тезауруса
состоит из следующих операций: определение тематического охва-
та тезауруса, сбор исходного массива ключевых слов, их лексиког-
рафическая обработка, установление условной эквивалентности
между ними, отбор на этой основе дескрипторов и установление па-
радигматических отношений между ними и, наконец, окончатель-
ное оформление тезауруса. Заметим, что вся эта работа проводится
на лингвистической основе. Так, например, установление условной
эквивалентности проверяется по текстам, в которых встречаются
ключевые слова. Если замена одного слова другим во всех контек-
стах не приводит к искажению смысла с точки зрения специалиста,
то между словами имеет место условная эквивалентность.
Темпы развития науки непрерывно убыстряются, и сейчас не-
возможно прогнозировать, какие науки выйдут на передний край в
ближайшем будущем. Поэтому современному ученому нужна ши-
рокая подготовка. Ему недостаточно знакомства с достижениями в
своей области. Иметь широкий кругозор — значит иметь представ-
ление и о том, что делается в других специальностях. Компьютер-
ная неподготовленность филологов и неоснащенность школ и гу-
58
манитарных вузов компьютерами задерживали применение этой
техники для перечисленных выше целей. В 1986 —1987 годах в ад-
министративном порядке проведена кампания по ликвидации
компьютерной неграмотности среди преподавателей высшей шко-
лы с целью подготовки лингвистов к использованию вычислитель-
ной техники в лингвистических исследованиях и при обучении
языкам.
Машинами, однако, вузы и сейчас не обеспечены, и, кроме того,
принципиально новая техника требует и создания новых методик
и нового учебного и исследовательского материала. Нельзя, напри-
мер, переносить на дисплей старые упражнения и называть это ав-
томатизированной системой обучения. Несоответствие задач и ма-
териала лингвистического исследования возможностям компьюте-
ризации тоже приводит к бессмыслице.
В английском языке существует даже специальный дерогатив-
ный акроним, высмеивающий неграмотное применение компью-
теров: GIGO — Garbage In, Garbage Out — так шутливо называются
случаи, когда неверная и бесполезная информация, заложенная на
входе, дает ерунду на выходе.
Своеобразный триумфальный марш совершила в нашем веке
математика. На наших глазах происходит общая математизация
знаний и не только в лингвистике, но и в других науках, например
в биологии. Важно иметь в виду, что математизация той или иной
науки не сводится к приложению уже существующих математиче-
ских методов, но требует поисков нового математического аппара-
та, адекватного новым задачам.
Лингвистов, к сожалению, иногда завораживает выражение
«точные науки», создается некоторый «комплекс неполноценно-
сти», им кажется, что, применяя какой-нибудь математический ап-
парат, они тем самым гарантируют себе получение точных и объ-
ективных данных. На самом деле это не совсем так: грамотно вы-
бранный математический аппарат позволяет обобщить получен-
ные данные или представить материал в более организованном ви-
де, или, наконец, создать модель явления. Нельзя, однако, забы-
вать, что модель неизбежно огрубляет действительность. Сам Берт-
ран Рассел сказал: «Как это ни парадоксально, но всякая точная на-
ука подчинена идее приближенности».
Представления о математизации лингвистики часто несколько
примитивны и, как отмечали многие специалисты по математиче-
ской лингвистике и у нас и за рубежом, связаны с некоторыми
предрассудками.
59
В действительности далеко не всякое применение чисел или
математического аппарата или компьютеров делает результаты
строгими и научными. Неверно также думать, что математика обя-
зательно связана с количественными оценками и со статистикой.
Современная математика изучает абстрактные системы, из кото-
рых лишь некоторые являются количественными, и вычисления
часто играют лишь вспомогательную роль.
О том, с какой осторожностью следует применять статистиче-
ские методы, и об опасности некорректного использования стати-
стики, предупреждал наш великий физик П.Л. Капица. «Хорошо
известно — писал он — что нужна большая осторожность, чтобы при
ограниченном числе статистических данных вывести из них об-
щую закономерность. Как-то, говоря о применении статистики,
кто-то сказал „Существует три вида лжи: ложь, наглая ложь и ста-
тистика". Правда, это было сказано о статистике общественных
процессов, но, до известной степени, это может относиться и
к при-
менению статистики в физике. Ни в одной области физики не было
сделано столько грубейших ошибок и ложных открытий, как при
обработке статистических данных, полученных в результате ядер-
ных столкновений»
Do'stlaringiz bilan baham: