Hzamatjon RfiHlmqu kompyuter imvistikasi asoslar I иЛК: 519. 711 32. 973 R33



Download 10,2 Mb.
bet22/87
Sana08.02.2022
Hajmi10,2 Mb.
#436695
1   ...   18   19   20   21   22   23   24   25   ...   87
Bog'liq
Kompyuter lingvistikasi. 2011. A.Rahimov

Шаумян С К Теоретические основы трансформационной грамматики // Новое в лингвистике Выпуск 11 - С.391 - 411.KOMPYVTER LINGVIS HKASIDA MATEMATIK STATISTIKA VA KVANTITATIV METOD

Reja:

          1. Matnm.ig statistik tahhli.

          2. Kvantit iuv metod va uning tilga latbiqi.

          3. Chastotali lug'atlar.

          4. Flektiv tillarda o'zakni aniqlash, polisemantik so'zlarni va sinonimik qatorda dommanta so'zni aniqlash.

Tayanch so'z va iboralar: kvaniitaiiv metod. matematik parametr, statis- lika, jideks, tanlama, tanlamaiung hajmi. absolut chastota, nisbiv chastota. lisoniy tip, flektiv tillar, agglutinativ tillarMrliastotali lug'atlar, matnning statistik taltlili, Zif qonuni, main atrihutsiyasi, anonim va psevdnmm mativ lar, idiostil, polisemantik so 'zlar, sinonimik qator, dominanta, to 'plum ling- vostatistika.
Statistik tahlil metocn boshqa fanlar qaton Mlshunoslik fani uchun ham muh.m ahamiyatga ega. Bunda tiida mavjud hodisalar aniq matematik parametrlarda baholanadi. tekshniladi. Statistika lotincha «status» so'zidan olingan boiib. hodbalarning holati, ahvolini bildiradi. «Status» so'zidan «stato» - davlat, «statusta» - davlatni biluvchi, «slatustica» - davlat to'g'nsida muayyan b'hm, ma'lumotlar yig'indisi ma'nosini bildiruvchi so'zlar kelio chiqqan 32 Bundan 3500 yil oldin Qad.mgi Misrda o'tkazilgan aholi hisobi, Rossiyada Pyotr I davridagi «aholi taftishi», Angliyadagi «Dahshatli sud kitobi» kabilar dastlabki statistik ma'lumotlardir
XVII asrda Angliyada yuzaga kelgan «siyosiy arifmetika» (U.Petti va Jon Giauntlar nomi bilan bog'liq) fani statistikaning shakllamshiga asos bo'lgan. Statistika ;,f.moiy hodualarning miqdoriy tomonlarin ularning sifat tomonlari bilan uzviy aloqadorhkda o'rganuvchi fandir. Hodisalar- ningsifat tomoniar ni maxsus fanlar o'rganadi. Xususan, tovushlar, so zlar, gaplarni lingvislika. qofiya, ritm, vazn, she'r tuzilishini adabiyotshunoslik, orgamk hayotm biologiya, yer qatlamlan va boyliklarini geologiya kabi fanlai o'rganadi. Statistika esa ushbu hodisalarni miqdoriy parametrlar aso­sida о rganadi Bunda statistika hodisalarni turli omillar ta'siridagi o'/garuvchanlik xususiyatini - vai. itsiyasim e'tiborga olad Shu j.hatdan stali >tik ma'lumotlar hodisalar rivciiningdinamikasini aksettna oiaui. Lekin slui o'rinda aytib o"tish lozimk., stahot.kaga yagona mutlaq haqiqat deb yoadashish, statistik ma'lumotlarga haddan tashqaii ishonbh ham to'g'ri emas. Ayrim yolg'on faktik materiallarga asoslamb tayyorlangan statistik ma'lumotlar hodisalar haqida xato tushunchalar berishi mumkin. Shu ma'noda statistika yuzasidan shunday hazilomuz gap ayt.lad1 «Yolg'onnmg uch ttiri bor: a) yolg'on; b) g irt^o'lg'on; c) statistika».
Statistikampg til hodbalariga tatbiq etilishi natijaoida lingvostatiotika sohasi shakllandi. unda til birliklari. lisoniv hodisalar, matnlar statistik tah­lil etiladi. Matnmng statistik tahhli - tilni chtimollik belgilariga ko'ra tahlil q i sh, til hodisalar.ni lg statistik xarakteri tikalari asosida baholash de- makdir. Til b.rlipim.ig gapda yoki matnda qo'llanish chastotasi (sur'at1) chtimollik dc>iladi. Til hodisalau haq-dagi haq;qatlar lingvosta'ist'k tad- qiqotlar yordamida amalanadi. Masalan, o'zbek till uchun qaysi bo'g in strukturasi tipik ekanligim, gap modellaridan qaysi biri eng asosiy konst­ruksiya ekanli>;ini, bosh kelismkdagi otlarning asosan qaysi gap bo'lagi va/.ilasida kelishini, tanlangan matnda so'z turkumlarining qay darajada ishlatii.shini an.qlash uchun lingvostaustik tahl.llarga chtiyo] seziladi.
T'l hodisalanni statistik metod asos.da tahlil < [ilish uchun doim ma'lum bii matn yoki matnlar to'plami olmadi Ular badny adabiyotdan, gazcta va uirnallardan, pubhUistik maqolalardan, ilmiy asarlardan, du.lcktologlar- ningjonli nutqidan yozib olgan matciiallandan tanlanadi. Statistik xusu 4yati o'rganilayotgan muayyan matnlar «tanlama» deyiladi. Tanlainaning hajmi teksl rilayotgan hodisalarnmg umumiy sor.idir uni «Н» bilan beigi­lash mum! in. Masalan, 100 ta so'/£ 37 ta bosh kelishik shaklidagi ot kabi. Aniqlanayotgan hodisam ko'rsatadigan miqdor (masalan, ot oldida aniqlov­chi vazifasida keladigan takrorlangan otlar miqdori) ahsolut chastota hisob­lanadi, un. «М» harfi bilan beigilash mumkin. 37 ta otdan 30 tasining an.qlovch. vazifasida kelishi absolut chastotadir. Absolut chastota (M)ning tanlama hajmi (Higa nisbao (M/H)aan nisbiy chastota kelib chiqadi.33 Nis- biy chastota «Р» harfi bilan bel} llanadi Nisbiy chastota uch xil usul bilan amqlanadi:

            1. oddiy kasr hisobida: P = M/H

            2. protsent asosida: P = МЧ100/Н

            3. promil hisobida: Р=МЧ 1000/H

Matnning stati: tiK tahl i da Zif qonunidan o'rinn foydalaniladi. Katta hajindagi matnlarda hai bir so'zning qanchaiik tez takrorlanish. i (chasto- tasim) va ularuing takrorlanish tezligini hisoblashda Zit' qonuni amal qila­di.49 Bunda so'zning chastotasi (f), uning ro'yxatdagi holati qatori (>■) deb belgiianadi. Zif qonuniga ko'ra, matnda eng ko'p ishlatilgan so'z r = 1, undan pastroq chastotada kuzatilgan so'z r = 2, undan keyingisi r = 3 tarzida belpdanadi Bundan kelib chiqadiki matndaj i ixtiyoriy so'z uchun (0 chas- totaga (r)n'"g ko'paytmasi fltijasi o'zgarmas miqdor- konstanta (C)ga teng bo'ladi (r4f = C), bu yerda С matn hajmiga bog'liq. Masalan, amerikalik yozuvchi Mark Tvenning «Tom Soyerning sarguzashtlari» asari Zif qonum asosida tahlil etilgan. Asarda jami 71 370 ta belgi mavjud bo'lib, takror- lanmagan so'z tipla/i 8018 ta. Matnda ishlat'lgan so'zlarning o'rtacha tak­rorlanish chastota l 8.9 dir, ya'ni natndag so'zlar taqriban 9 marta takror- lanadi. Lekin bunda eng katta muammo shuki, so'z tiplai inmg barchasi matn ichida qo'llanish darajasi bir xil emas. Ayrim so'zlar 700 marta tak- rorlanadi, bunday so'zlar romanning 1% qismmi tashkil etadi. Yana shun­day so'zlar ham borki ular bir marta takrorlanadi. Bunday so'zlar hapas кцотспа (yunoncha so'z «faqat b'r marta o'qiS, degan ma'nom anglataai) deb ataladi, ular asari.ing qariyb ^atliini tashkil etadi. Qariyb 90% so'zlar 10 marta yoki undan kam, 10% ga yaqin so'z tiplari 3 marta yoki undan kam miqdorda takrorlanadi.
6-jadval


Download 10,2 Mb.

Do'stlaringiz bilan baham:
1   ...   18   19   20   21   22   23   24   25   ...   87




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish