Обсуждены и интерпретированы основные вопросы компьютерной лингвистики


hajmi  tekshirilayotgan  ho d isalarn in g   um um iy  sonidir,  uni  «Н »



Download 53,48 Mb.
Pdf ko'rish
bet50/163
Sana26.07.2021
Hajmi53,48 Mb.
#128715
1   ...   46   47   48   49   50   51   52   53   ...   163
Bog'liq
Kompyuter lingvistikasi. A.Rahimov

hajmi  tekshirilayotgan  ho d isalarn in g   um um iy  sonidir,  uni  «Н »  bilan  belgi­
lash  m um kin.  M asalan,  100  ta  s o ‘z;  37  ta  bosh  kelishik  shaklidagi  ot  kabi. 
A niqlanayotgan hodisani k o ‘rsatadigan m iqdor (m asalan, ot oldida aniqlov- 
chi vazifasida keladigan ta k ro rla n g a n  o tlar m iqdori)  absolut chastota hisob­
lan ad i,  uni  «М »  harfi  b ilan   belgilash  m um kin.  37  ta   o td a n   30  tasining 
aniqlovchi vazifasida  kelishi  ab so lu t chastotadir.  A b so lu t c h a sto ta (M )ning 
tan lam a  hajm i  (H )ga  nisbati  (M /H )d an   nisbiy  chastota  kelib chiqadi.48 Nis- 
biy  c h asto ta  «Р»  harfi  bilan  belgilanadi.  N isbiy  c h asto ta  uch  xil  usul  bilan 
a n iq la n a d i:
a) oddiy k asr hisobida:  P =  M /H
b) p ro tsen t asosida:  P =   М Ч 100/Н
c)  prom il  hisobida:  Р  =   М Ч   1000/H
M atn n in g   statistik  tahlilida  Z if q o n u n id an   o ‘rinli  foydalaniladi.  K a tta
48  Усмонов  С.  Умумий  тилшунослик.  -  Тошкент:  У^итувчи,  1972.  -   Б .199.


50
A. Rahimov
hajm dagi m a tn la rd a  h a r bir s o ‘zning qan ch alik  tez tak ro rlan ish in i  (chasto- 
tasini)  va  ularn in g   tak ro rlan ish   tezligini  h isoblashda  Z if qonuni  am al  q ila­
di.49  B unda so ‘zning chastotasi  ( f ) ,  uning ro 'y x a td a g i holati  q ato ri  (r )  deb 
belgilanadi.  Z if q o n u n ig a  k o ‘ra,  m a tn d a   eng  k o ‘p  ishlatilgan  so ‘z  г  =  1, 
undan p astro q  c h a sto tad a kuzatilgan so ‘z r = 2, u n d an  keyingisi r = 3 tarzida 
belgilanadi.  B undan kelib chiqadiki, m atn d ag i ixtiyoriy so ‘z u chun (f) chas- 
to tag a (r)ning k o 'p ay tm asi natijasi o ‘zgarm as m iq d o r -  k o n stan ta (C )ga teng 
b o ‘ladi  ( r 4 f  =   C),  bu  yerda  С  m atn   hajm iga  b o g 'liq .  M asalan,  am erikalik 
yozuvchi  M a rk  T venning «Т ош   Soyerning sarguzashtlari»  asari  Z if q onuni 
asosida  tahlil  etilgan.  A sard a jam i  71  370  ta   belgi  m avjud  b o ‘lib,  ta k ro r- 
lanm agan  so ‘z tip lari  8018  ta.  M a tn d a  ishlatilgan  so ‘zlarning o ‘rtach a  ta k ­
rorlanish ch asto tasi 8,9 dir, y a ’ni m atn d ag i so ‘zlar ta q rib an  9 m a rta  ta k ro r- 
lanadi.  Lekin  b u n d a   eng  k a tta   m uam m o  shuki,  so ‘z  tip larin in g   barchasi 
m atn   ichida  q o 'lla n ish   darajasi  bir  xil  em as.  A yrim   so ‘zlar  700  m a rta   tak- 
ro rlan ad i,  b u n d ay   s o 'z la r  ro m anning  1%  qism ini  tashkil etadi.  Y an a  sh u n ­
day  so 'z la r  ham   b o rk i,  ular  bir  m a rta   ta k ro rla n a d i.  B unday  so 'z la r  hapas 
legomena  (y u n o n ch a so ‘z «faq at  bir m a rta   o ‘qi»,  degan m a ’noni  anglatadi) 
deb  ataladi,  u lar  asarning  q ariyb  yarm ini  tashkil  etadi.  Q ariyb  90%  s o ‘zlar 
10  m a rta   yoki  u n d a n   kam ,  10%  ga  yaqin  so ‘z  tiplari  3  m a rta   yoki  u n d an  
kam   m iq d o rd a  ta k ro rlan ad i.
6-jadval
Word
(So**)
Frequency
(Chastota)
Rank
(Qator)
f4 r
the
3332
1
3332
а
1775
3
5235
and
2972
2
5944
he
877
10
8770
but
410
20
8400
be
294
30
8820
there
222
40
8880
one
172
50
8600
about
158
60
9480
more
138
70
9660
never
124
80
9920
oh
116
90
10 440
two
104
100
10 400
49  Плат  У.  Математическая  лингвистика  //  Новое  в  лингвистике.  -   М.: 
Прогресс,  1965.  Вып.IV.  -  С.204.


Kompyuter  lingvistikasi asoslari
51
turned
51
200
10 200
You'll
30
300
9000
name
21
400
8400
comes
16
500
8000
group
13
600
7800
lead
11
700
7700
friends
10
800
8000
begin
9
900
8100
family
8
1000
8000
brushed
4
2000
8000
sins
2
3000
6000
could
2
4000
6000
applausive
1
8000
8000
M atn n in g  statistik  tahlili  m atn   atributsiyasi  m uam m osiga  ham  oydinlik 
kiritishda  m uhim   tadqiqot  usuli  h isoblanadi.  A yniqsa,  badiiy  m atn larn in g  
statistik  tahlili  natijasida  o 's h a   m atn   m uallifi  ham   aniq lan m o q d a.  B unda 
m a tn d a   tez-tez ishlatiluvchi  til  birliklari  (o tlar,  sifatlar,  kalit so 'z la r,  fe’llar, 
gram m atik  shakllar, jum la  qurilishi,  bir  s o ‘z  bilan  aytganda,  yozuvchining 
idiostilini -  o ‘ziga  xos  uslubini  k o ‘rsatuvchi  vositalai)  lingvostatistik  tahlil 
y o rd am id a  aniqlanadi.  T urli  m a tn lard an   olingan  dalillarning  qiyosiy  ta h ­
lili bizga o 's h a  m atnning m azm un-m undarijasini,  m atn  tuzilgan  davrni,  da- 
lillarni  argum entlash  x arak terin i  va  h a tto   m ualliflikni  aniq lash g a  im kon 
beradi.  Badiiy  asarlarning  sujet  qurilishiga,  m atn   stru k tu rasig a  kvantitativ 
m e to d la r n in g   ta tb iq   e tilis h i  n a tija s id a   F .D o s to y e v s k iy ,  L .T o ls to y , 
M .Sholoxov kabi yozuvchilarning m atn lari  atributsiyasi  am alga oshirilgan. 
Keyingi paytlarda anonim  (muallifi n o m a ’lum) va psevdonim  (soxta muallifli) 
m atn larn in g  aniqlanishi yuzasidan  ham   ta d q iq o tla r am alga o sh irilm o q d a.50 
Bu asp ek t  krim inalistika  sohasida  m uhim   ah am iy at  kasb etm o q d a.
A m erikalik  olim   Jozef  G rin b erg   k v an titativ   m etodni  tilshunoslikka  -  
m orfologik  tiplar nazariyasiga  tatb iq   etgan.  T ad q iq o t  natijalarini  «Quanti­
tative  approach  to  the  morphological  typology o f  languages»  (1960)  («Tillar 
m orfologik tipologiyasiga kvantitativ yondashuv»)  nom li m aqolasida um um - 
lashtirgan.  Olim  o ‘zigacha  am alga  oshirilgan  ishlar  h aqida  shu n d ay   yoza- 
di:  «Tillarning  tipologik  tasnifi  m antiqiy-ratsional  mezonlar  asosida  yu za ­
ga  kelgan.  T a sn if namunalari  nazariy jih a td a n   asoslangan,  am m o  lingvisti/c 
f a k t   bilan  uzviyligi yaqqol  ко ‘zga  tashlanmaydi.  Bu  esa  tasnifni  amaliyotga
50 
Баранов  A .H .  Введение  в  пр и кл а д н у ю   л и н гв и сти ку.  -   М .:  Э диториал 
У Р С С ,  2 0 0 1 .- С .2 4 .


52
A. Rahimov
tatbiq etib  tekshirishni taqozo  etadi».5'  Shu n u q tay i n a zard an   olim   m a te m a ­
tik  an iq lik k a  erishish  m aq sad id a  til  hodisalarini,  m avjud  lisoniy  tip larn in g  
uchrash darajasini m iqdoriy p a ra m e trlar asosida q ay ta baholadi. J.G rin b erg  
k v an titativ  m etodni  8  tilga  (sanskrit,  anglo-saks,  y o q u t, vyetnam , fors,  ing- 
liz,  suaxili,  eskim os  tillariga)  ta tb iq   qilgan.  B unda  olim   o ‘zi  belgilagan  for- 
m u lalar  asosida  lisoniy  tiplarning  va  tillard a  kuzatiladigan  tipologik  belgi­
la rn in g   m iq d o riy   tavsifini,  sta tistik   m a ’lu m o tla rn i  ilm iy  ja m o a tc h ilik k a  
h avola  etdi.
M asalan ,  sintetiklikning dun y o   tillaridagi  darajasini  aniqlash  u ch u n   М / 

Download 53,48 Mb.

Do'stlaringiz bilan baham:
1   ...   46   47   48   49   50   51   52   53   ...   163




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish