KORPUS LINGVISTIKASINING SHAKLLANISH TARAQQIYOTI
M.Abdurahmanova
O
ʻ
zMU dotsenti
Ishonarli lingvistik ma‘lumotlar
katta massivli matnlar majmuasidangina olinishi mumkin
R.G.Piotrovskiy
Jahon tilshunosligi va turkologiyada amaliy lingvistika, kompyuter lingvistikasi, korpus
lingvistikasi muammolariga oid tadqiqotlar olib borilmoqda. Ma‗lumki, Korus lingvistikasining
rivojlanishi, milliy tildagi ma‘lumotlar bazasini shakllantirish, tilning lug
ʻ
at boyligini kengay-
tirishda asosiy omillardan hisoblanadi. Xalqaro tillar sanalgan ingliz, ispan, xitoy, arab, fransuz,
rus tillarining milliy korpusidan tashqari, nemis, polyak, ukrain, chex, slovak, serb, xorvat, bos-
niya, bolgar, makedon, shotland, niderland, shved, dat, norveg, island, portugal, rumin, litva,
latish, grek, arman, osetin, alban, hind, xet, fin, ural tillari, eston, venger, udmurt, gruzin, lezgin,
buryat, mo
ʻ
g
ʻ
ul, ivrit, qalmiq, yapon, turk, tatar, boshqird, qrim-tatar, qozoq tillari korpuslari
mavjud.
V.Zaxarov ―Matnlarning lingvistik korpusi katta, elektron ko
ʻ
rinishda taqdim etilgan, bir-
lashtirilgan, tuzilgan tagged, muayyan lingvistik muammolarni hal qilish uchun mo
ʻ
ljallangan til
ma‘lumotlarining filologik jihatdan vakolatli qatori‖ deb ta‘riflaydi. Korpus bu tilning tanasidir.
Tilning tanasini chuqurroq o
ʻ
rganishda nafaqat tilshunoslar balki dasturchilarning ham o
ʻ
rni be-
qiyosdir. Shunga ko
ʻ
ra, so
ʻ
nggi yillarda tadqiqning korpus metodidan foydalanishga qiziqishning
kuchayishiga matnlarning katta massivini qayta ishlash imkonini beruvchi kompyuter texno-
logiyasining kirib kelishi sabab bo
ʻ
ldi. Korpus sohasidagi asosiy tadqiqotlar XX asrning o
ʻ
rta-
larida paydo bo
ʻ
la boshlandi. Ilk bor korpus matnlari bolaning nutqini o
ʻ
rganishda, til o
ʻ
rgatishda
va og
ʻ
zaki nutq grammatikasini o
ʻ
qitishda foydalanildi. 50-yillarda Noam Xomskiy konsepsiyasi
ustunlik qila boshladi. Ushbu yo
ʻ
nalish nutqiy qo
ʻ
llanishni emas, tilni o
ʻ
rganish lozim, degan
g
ʻ
oya ilgari surardi. Chunki tilda nutqiy qo
ʻ
llanish son-sanoqsiz, ularni o
ʻ
rganish befoyda. Til
mohiyati, imkoniyatini ifodalaydigan qonuniyatlar esa sanoqli, demak, ularni tadqiq etish mum-
kin va maqsadga muvofiq, deb hisoblangan. Bundan tashqari, aksariyat olimlar tilni tadqiq etish-
da introspeksiya (o
ʻ
z-o
ʻ
zini kuzatish), tabiiy faktga tayanish usuli doim ham aynan bir xil natija
beravermaydi, degan fikrga tayangan. Natijada tilshunoslikda ratsionalistlar (Xomskiy tarafdor-
lari) va empiriklar (korpus lingvistlari) armiyasi vujudga keladi. Mashhur korpus lingvistikasi
mutaxassisi Toni Mak-Enneri Edinburg ham empirik fakt, introspeksiyadan, ham tabiiy, sun‘iy
faktdan foydalanish lozimligini uqtiradi. Korpus lingvistikasi nazariy hamda amaliy bilimlarga
asoslanadi. Korpusni tuzish (qog
ʻ
ozlarda-kartoteka), o
ʻ
rganish korpus lingvistikasi sohasi rivojla-
nishidan ancha oldin XVIII asrlarda boshlandi (Teologiya-bibliyaga oid tadqiqotlar, lug
ʻ
atlar
(Johnson, Oxford English Dictionary, Webster Dictionary), tillarni o
ʻ
qitish (1921), Kvirk korpusi
(Survey of English Usage). Inglizcha
Corpus linguistics
atamasi ilk marta 1984-yilda qo
ʻ
llangan.
Birinchi korpus Buyuk Britaniyada paydo bo
ʻ
lgan. Rossiyaga ushbu atama korpus lingvistikasi
mutaxassisi – mashhur xalqaro ingliz tili korpusi (Internetional Corpus of English) asoschisi
Sidni Grinbaum
Do'stlaringiz bilan baham: |