Шаумян С К Теоретические основы трансформационной грамматики // Новое в лингвистике Выпуск 11 - С.391 - 411.KOMPYVTER LINGVIS HKASIDA MATEMATIK STATISTIKA VA KVANTITATIV METOD
Reja:
Matnm.ig statistik tahhli.
Kvantit iuv metod va uning tilga latbiqi.
Chastotali lug'atlar.
Flektiv tillarda o'zakni aniqlash, polisemantik so'zlarni va sinonimik qatorda dommanta so'zni aniqlash.
Tayanch so'z va iboralar: kvaniitaiiv metod. matematik parametr, statis- lika, jideks, tanlama, tanlamaiung hajmi. absolut chastota, nisbiv chastota. lisoniy tip, flektiv tillar, agglutinativ tillarMrliastotali lug'atlar, matnning statistik taltlili, Zif qonuni, main atrihutsiyasi, anonim va psevdnmm mativ lar, idiostil, polisemantik so 'zlar, sinonimik qator, dominanta, to 'plum ling- vostatistika.
Statistik tahlil metocn boshqa fanlar qaton Mlshunoslik fani uchun ham muh.m ahamiyatga ega. Bunda tiida mavjud hodisalar aniq matematik parametrlarda baholanadi. tekshniladi. Statistika lotincha «status» so'zidan olingan boiib. hodbalarning holati, ahvolini bildiradi. «Status» so'zidan «stato» - davlat, «statusta» - davlatni biluvchi, «slatustica» - davlat to'g'nsida muayyan b'hm, ma'lumotlar yig'indisi ma'nosini bildiruvchi so'zlar kelio chiqqan 32 Bundan 3500 yil oldin Qad.mgi Misrda o'tkazilgan aholi hisobi, Rossiyada Pyotr I davridagi «aholi taftishi», Angliyadagi «Dahshatli sud kitobi» kabilar dastlabki statistik ma'lumotlardir
XVII asrda Angliyada yuzaga kelgan «siyosiy arifmetika» (U.Petti va Jon Giauntlar nomi bilan bog'liq) fani statistikaning shakllamshiga asos bo'lgan. Statistika ;,f.moiy hodualarning miqdoriy tomonlarin ularning sifat tomonlari bilan uzviy aloqadorhkda o'rganuvchi fandir. Hodisalar- ningsifat tomoniar ni maxsus fanlar o'rganadi. Xususan, tovushlar, so zlar, gaplarni lingvislika. qofiya, ritm, vazn, she'r tuzilishini adabiyotshunoslik, orgamk hayotm biologiya, yer qatlamlan va boyliklarini geologiya kabi fanlai o'rganadi. Statistika esa ushbu hodisalarni miqdoriy parametrlar asosida о rganadi Bunda statistika hodisalarni turli omillar ta'siridagi o'/garuvchanlik xususiyatini - vai. itsiyasim e'tiborga olad Shu j.hatdan stali >tik ma'lumotlar hodisalar rivciiningdinamikasini aksettna oiaui. Lekin slui o'rinda aytib o"tish lozimk., stahot.kaga yagona mutlaq haqiqat deb yoadashish, statistik ma'lumotlarga haddan tashqaii ishonbh ham to'g'ri emas. Ayrim yolg'on faktik materiallarga asoslamb tayyorlangan statistik ma'lumotlar hodisalar haqida xato tushunchalar berishi mumkin. Shu ma'noda statistika yuzasidan shunday hazilomuz gap ayt.lad1 «Yolg'onnmg uch ttiri bor: a) yolg'on; b) g irt^o'lg'on; c) statistika».
Statistikampg til hodbalariga tatbiq etilishi natijaoida lingvostatiotika sohasi shakllandi. unda til birliklari. lisoniv hodisalar, matnlar statistik tahlil etiladi. Matnmng statistik tahhli - tilni chtimollik belgilariga ko'ra tahlil q i sh, til hodisalar.ni lg statistik xarakteri tikalari asosida baholash de- makdir. Til b.rlipim.ig gapda yoki matnda qo'llanish chastotasi (sur'at1) chtimollik dc>iladi. Til hodisalau haq-dagi haq;qatlar lingvosta'ist'k tad- qiqotlar yordamida amalanadi. Masalan, o'zbek till uchun qaysi bo'g in strukturasi tipik ekanligim, gap modellaridan qaysi biri eng asosiy konstruksiya ekanli>;ini, bosh kelismkdagi otlarning asosan qaysi gap bo'lagi va/.ilasida kelishini, tanlangan matnda so'z turkumlarining qay darajada ishlatii.shini an.qlash uchun lingvostaustik tahl.llarga chtiyo] seziladi.
T'l hodisalanni statistik metod asos.da tahlil < [ilish uchun doim ma'lum bii matn yoki matnlar to'plami olmadi Ular badny adabiyotdan, gazcta va uirnallardan, pubhUistik maqolalardan, ilmiy asarlardan, du.lcktologlar- ningjonli nutqidan yozib olgan matciiallandan tanlanadi. Statistik xusu 4yati o'rganilayotgan muayyan matnlar «tanlama» deyiladi. Tanlainaning hajmi teksl rilayotgan hodisalarnmg umumiy sor.idir uni «Н» bilan beigilash mum! in. Masalan, 100 ta so'/£ 37 ta bosh kelishik shaklidagi ot kabi. Aniqlanayotgan hodisam ko'rsatadigan miqdor (masalan, ot oldida aniqlovchi vazifasida keladigan takrorlangan otlar miqdori) ahsolut chastota hisoblanadi, un. «М» harfi bilan beigilash mumkin. 37 ta otdan 30 tasining an.qlovch. vazifasida kelishi absolut chastotadir. Absolut chastota (M)ning tanlama hajmi (Higa nisbao (M/H)aan nisbiy chastota kelib chiqadi.33 Nis- biy chastota «Р» harfi bilan bel} llanadi Nisbiy chastota uch xil usul bilan amqlanadi:
oddiy kasr hisobida: P = M/H
protsent asosida: P = МЧ100/Н
promil hisobida: Р=МЧ 1000/H
Matnning stati: tiK tahl i da Zif qonunidan o'rinn foydalaniladi. Katta hajindagi matnlarda hai bir so'zning qanchaiik tez takrorlanish. i (chasto- tasim) va ularuing takrorlanish tezligini hisoblashda Zit' qonuni amal qiladi.49 Bunda so'zning chastotasi (f), uning ro'yxatdagi holati qatori (>■) deb belgiianadi. Zif qonuniga ko'ra, matnda eng ko'p ishlatilgan so'z r = 1, undan pastroq chastotada kuzatilgan so'z r = 2, undan keyingisi r = 3 tarzida belpdanadi Bundan kelib chiqadiki matndaj i ixtiyoriy so'z uchun (0 chas- totaga (r)n'"g ko'paytmasi fltijasi o'zgarmas miqdor- konstanta (C)ga teng bo'ladi (r4f = C), bu yerda С matn hajmiga bog'liq. Masalan, amerikalik yozuvchi Mark Tvenning «Tom Soyerning sarguzashtlari» asari Zif qonum asosida tahlil etilgan. Asarda jami 71 370 ta belgi mavjud bo'lib, takror- lanmagan so'z tipla/i 8018 ta. Matnda ishlat'lgan so'zlarning o'rtacha takrorlanish chastota l 8.9 dir, ya'ni natndag so'zlar taqriban 9 marta takror- lanadi. Lekin bunda eng katta muammo shuki, so'z tiplai inmg barchasi matn ichida qo'llanish darajasi bir xil emas. Ayrim so'zlar 700 marta tak- rorlanadi, bunday so'zlar romanning 1% qismmi tashkil etadi. Yana shunday so'zlar ham borki ular bir marta takrorlanadi. Bunday so'zlar hapas кцотспа (yunoncha so'z «faqat b'r marta o'qiS, degan ma'nom anglataai) deb ataladi, ular asari.ing qariyb ^atliini tashkil etadi. Qariyb 90% so'zlar 10 marta yoki undan kam, 10% ga yaqin so'z tiplari 3 marta yoki undan kam miqdorda takrorlanadi.
6-jadval
Do'stlaringiz bilan baham: |