hajmi tekshirilayotgan ho d isalarn in g um um iy sonidir, uni «Н » bilan belgi
lash m um kin. M asalan, 100 ta s o ‘z; 37 ta bosh kelishik shaklidagi ot kabi.
A niqlanayotgan hodisani k o ‘rsatadigan m iqdor (m asalan, ot oldida aniqlov-
chi vazifasida keladigan ta k ro rla n g a n o tlar m iqdori) absolut chastota hisob
lan ad i, uni «М » harfi b ilan belgilash m um kin. 37 ta o td a n 30 tasining
aniqlovchi vazifasida kelishi ab so lu t chastotadir. A b so lu t c h a sto ta (M )ning
tan lam a hajm i (H )ga nisbati (M /H )d an nisbiy chastota kelib chiqadi.48 Nis-
biy c h asto ta «Р» harfi bilan belgilanadi. N isbiy c h asto ta uch xil usul bilan
a n iq la n a d i:
a) oddiy k asr hisobida: P = M /H
b) p ro tsen t asosida: P = М Ч 100/Н
c) prom il hisobida: Р = М Ч 1000/H
M atn n in g statistik tahlilida Z if q o n u n id an o ‘rinli foydalaniladi. K a tta
48 Усмонов С. Умумий тилшунослик. - Тошкент: У^итувчи, 1972. - Б .199.
50
A. Rahimov
hajm dagi m a tn la rd a h a r bir s o ‘zning qan ch alik tez tak ro rlan ish in i (chasto-
tasini) va ularn in g tak ro rlan ish tezligini h isoblashda Z if qonuni am al q ila
di.49 B unda so ‘zning chastotasi ( f ) , uning ro 'y x a td a g i holati q ato ri (r ) deb
belgilanadi. Z if q o n u n ig a k o ‘ra, m a tn d a eng k o ‘p ishlatilgan so ‘z г = 1,
undan p astro q c h a sto tad a kuzatilgan so ‘z r = 2, u n d an keyingisi r = 3 tarzida
belgilanadi. B undan kelib chiqadiki, m atn d ag i ixtiyoriy so ‘z u chun (f) chas-
to tag a (r)ning k o 'p ay tm asi natijasi o ‘zgarm as m iq d o r - k o n stan ta (C )ga teng
b o ‘ladi ( r 4 f = C), bu yerda С m atn hajm iga b o g 'liq . M asalan, am erikalik
yozuvchi M a rk T venning «Т ош Soyerning sarguzashtlari» asari Z if q onuni
asosida tahlil etilgan. A sard a jam i 71 370 ta belgi m avjud b o ‘lib, ta k ro r-
lanm agan so ‘z tip lari 8018 ta. M a tn d a ishlatilgan so ‘zlarning o ‘rtach a ta k
rorlanish ch asto tasi 8,9 dir, y a ’ni m atn d ag i so ‘zlar ta q rib an 9 m a rta ta k ro r-
lanadi. Lekin b u n d a eng k a tta m uam m o shuki, so ‘z tip larin in g barchasi
m atn ichida q o 'lla n ish darajasi bir xil em as. A yrim so ‘zlar 700 m a rta tak-
ro rlan ad i, b u n d ay s o 'z la r ro m anning 1% qism ini tashkil etadi. Y an a sh u n
day so 'z la r ham b o rk i, ular bir m a rta ta k ro rla n a d i. B unday so 'z la r hapas
legomena (y u n o n ch a so ‘z «faq at bir m a rta o ‘qi», degan m a ’noni anglatadi)
deb ataladi, u lar asarning q ariyb yarm ini tashkil etadi. Q ariyb 90% s o ‘zlar
10 m a rta yoki u n d a n kam , 10% ga yaqin so ‘z tiplari 3 m a rta yoki u n d an
kam m iq d o rd a ta k ro rlan ad i.
6-jadval
Word
(So**)
Frequency
(Chastota)
Rank
(Qator)
f4 r
the
3332
1
3332
а
1775
3
5235
and
2972
2
5944
he
877
10
8770
but
410
20
8400
be
294
30
8820
there
222
40
8880
one
172
50
8600
about
158
60
9480
more
138
70
9660
never
124
80
9920
oh
116
90
10 440
two
104
100
10 400
49 Плат У. Математическая лингвистика // Новое в лингвистике. - М.:
Прогресс, 1965. Вып.IV. - С.204.
Kompyuter lingvistikasi asoslari
51
turned
51
200
10 200
You'll
30
300
9000
name
21
400
8400
comes
16
500
8000
group
13
600
7800
lead
11
700
7700
friends
10
800
8000
begin
9
900
8100
family
8
1000
8000
brushed
4
2000
8000
sins
2
3000
6000
could
2
4000
6000
applausive
1
8000
8000
M atn n in g statistik tahlili m atn atributsiyasi m uam m osiga ham oydinlik
kiritishda m uhim tadqiqot usuli h isoblanadi. A yniqsa, badiiy m atn larn in g
statistik tahlili natijasida o 's h a m atn m uallifi ham aniq lan m o q d a. B unda
m a tn d a tez-tez ishlatiluvchi til birliklari (o tlar, sifatlar, kalit so 'z la r, fe’llar,
gram m atik shakllar, jum la qurilishi, bir s o ‘z bilan aytganda, yozuvchining
idiostilini - o ‘ziga xos uslubini k o ‘rsatuvchi vositalai) lingvostatistik tahlil
y o rd am id a aniqlanadi. T urli m a tn lard an olingan dalillarning qiyosiy ta h
lili bizga o 's h a m atnning m azm un-m undarijasini, m atn tuzilgan davrni, da-
lillarni argum entlash x arak terin i va h a tto m ualliflikni aniq lash g a im kon
beradi. Badiiy asarlarning sujet qurilishiga, m atn stru k tu rasig a kvantitativ
m e to d la r n in g ta tb iq e tilis h i n a tija s id a F .D o s to y e v s k iy , L .T o ls to y ,
M .Sholoxov kabi yozuvchilarning m atn lari atributsiyasi am alga oshirilgan.
Keyingi paytlarda anonim (muallifi n o m a ’lum) va psevdonim (soxta muallifli)
m atn larn in g aniqlanishi yuzasidan ham ta d q iq o tla r am alga o sh irilm o q d a.50
Bu asp ek t krim inalistika sohasida m uhim ah am iy at kasb etm o q d a.
A m erikalik olim Jozef G rin b erg k v an titativ m etodni tilshunoslikka -
m orfologik tiplar nazariyasiga tatb iq etgan. T ad q iq o t natijalarini «Quanti
tative approach to the morphological typology o f languages» (1960) («Tillar
m orfologik tipologiyasiga kvantitativ yondashuv») nom li m aqolasida um um -
lashtirgan. Olim o ‘zigacha am alga oshirilgan ishlar h aqida shu n d ay yoza-
di: «Tillarning tipologik tasnifi m antiqiy-ratsional mezonlar asosida yu za
ga kelgan. T a sn if namunalari nazariy jih a td a n asoslangan, am m o lingvisti/c
f a k t bilan uzviyligi yaqqol ко ‘zga tashlanmaydi. Bu esa tasnifni amaliyotga
50
Баранов A .H . Введение в пр и кл а д н у ю л и н гв и сти ку. - М .: Э диториал
У Р С С , 2 0 0 1 .- С .2 4 .
52
A. Rahimov
tatbiq etib tekshirishni taqozo etadi».5' Shu n u q tay i n a zard an olim m a te m a
tik an iq lik k a erishish m aq sad id a til hodisalarini, m avjud lisoniy tip larn in g
uchrash darajasini m iqdoriy p a ra m e trlar asosida q ay ta baholadi. J.G rin b erg
k v an titativ m etodni 8 tilga (sanskrit, anglo-saks, y o q u t, vyetnam , fors, ing-
liz, suaxili, eskim os tillariga) ta tb iq qilgan. B unda olim o ‘zi belgilagan for-
m u lalar asosida lisoniy tiplarning va tillard a kuzatiladigan tipologik belgi
la rn in g m iq d o riy tavsifini, sta tistik m a ’lu m o tla rn i ilm iy ja m o a tc h ilik k a
h avola etdi.
M asalan , sintetiklikning dun y o tillaridagi darajasini aniqlash u ch u n М /
Do'stlaringiz bilan baham: |