3. ВОПРОС О ПРЕДСТАВИТЕЛЬНОСТИ ВЫБОРКИ
Любое статистическое исследование языковой структуры не обхо-
дится без обращения к вопросу о выборочном методе, который являет-
ся эффективным способом сбора лингвостатистической информации.
Его роль в организации и проведении конкретного анализа определяется
в первую очередь тем, что в таком сложном системном объекте, каким
является множество лингвистических единиц в текстах, относящихся
к данному языку, стилю, подъязыку невозможно обследовать все едини-
цы, представляющие собою генеральную совокупность. Другими слова-
ми, выборочный метод неизбежен, когда изучается большая конечная
.
совокупность и нельзя подвергнуть ее полному, сплошному обследо-
.
ванию.
_______________
*Под г е н е р а л ь н о й с о в о к у п н о с т ь ю в теории вероятностей по-
нимается обширная совокупность, где число членов весьма велико, так что соот-
ношения между элементами выборки не изменяются при ее дальнейшем увели-
чении [33].
22
Цель выборочного метода заключается в том, чтобы произвести в
данных конкретных условиях наиболее надежную выборку, в которой
распределение лингвистических единиц было бы возможно ближе к рас-
пределению их в генеральной совокупности. Произведенная выборка
должна представлять в миниатюре все тексты данного функционального
стиля в той пропорции, которая существует в гипотетической генераль-
ной совокупности.
В математической статистике разработано несколько приемов
осуществления выборок. Наиболее часто употребляемые и хорошо раз-
работанные — случайные повторные выборки, которые производятся
в основных условиях: испытания независимы от изучаемого признака и
закон распределения признака остается постоянным в каждом испыта-
нии [23]. Процедура заключается в следующем: при помощи какого-
нибудь отборочного процесса (картинки с номерами, таблицы случайных
чисел и т. д.), обеспечивающего одинаковую возможность извлечения
для любой лингвистической единицы из генеральной совокупности,
каждая обследованная единица возвращается обратно в совокупность,
так что в следующий раз она может быть вновь обследована. Этот про-
цесс извлечения продолжается до тех пор, пока не получится выборка
требуемого объема. Однако такая процедура практически невыполнима
в наших условиях. При большом объеме генеральной совокупности мож-
но производить и бесповторные выборки, т.е. каждый обследованный
член генеральной совокупности не возвращается обратно в совокуп-
ность [88]. Во многих лингвистических работах осуществляется именно
такой тип выборки.
Случайность выборки гарантируется механическим способом извле-
чения ее из генеральной совокупности. Это осуществляется следующим
образом: минимальная выборка* производится из текстов с фиксиро-
ванного места.
Вопрос об объеме минимальной выборки является достаточно важ-
ным при решении вопроса об усредненной выборке по многим авторам.
При разумном объеме выборки должны быть удовлетворены следующие
условия: 1) отображение реальной картины распределения лингвисти-
ческих единиц в генеральной совокупности и 2) представление лексичес-
кого богатства данного подъязыка. От длины минимальной выборки
зависит количество текстов: чем меньше длина минимальной выборки,
тем большее число текстов включается в обследуемую совокупность,
а это дает возможность охватить большее количество ситуаций и появ-
ляется большая вероятность отразить совокупность лингвистических
единиц в пропорциях, существующих в генеральной совокупности и
отобрать словарный состав наиболее устойчивый по отношению к инди-
видуальной речи отдельных авторов (статей).
По данным лингвостатистических работ основное содержание науч-
ной статьи представляется текстом в 1000 словоупотреблений и этот
_______________
\
Do'stlaringiz bilan baham: |