KORPUS LINGVISTIKASI: MAZMUNI VA MOHIYATI
A.Rahmanova,
O
ʻ
zMU tayanch doktoranti.
M.Akramjonova,
magistrant
O
ʻ
zbek tiliga davlat tili maqomi berilishi milliy til imkoniyatlarini yanada oshirdi, funk-
sional doirasini yanada kengaytirdi. 2019- yil 4- oktabrda o
ʻ
zbek tiliga Davlat tili maqomi beril-
gan sananing 30 yilligini nishonlash to
ʻ
g
ʻ
risida Prezident qarori e‘lon qilindi. Mazkur qaror
davlat tili mavqeyini oshirish, uning mohiyatini keng xalq ommasiga singdirish, nafaqat
O
ʻ
zbekistonda, balki mamlakat tashqarisida, xorijdagi O
ʻ
zbekiston elchixonalari, vakolatxonala-
rida o
ʻ
zbek tiliga davlat tili maqomi berilgan sanani bayram sifatida nishonlash borasidagi chora-
tadbirlarni belgilashda dasturulamal vazifasini o
ʻ
tamoqda. O
ʻ
zbek tili nafaqat O
ʻ
zbekistondagi
o
ʻ
zbeklarning, balki dunyo bo
ʻ
ylab tarqalgan 50 mln.dan ortiq o
ʻ
zbeklarning muloqot vositasi
hisoblanadi. 2019- yil 21- oktabrda o
ʻ
zbek tilining davlat tili sifatidagi nufuzi va mavqeyini
tubdan oshirish chora-tadbirlari haqida Respublika Prezidenti farmoni e‘lon qilindi. Farmonda
o
ʻ
zbek tilining mavqeyini oshirish, uning funksional doirasini kengaytirish, axborot va ilm-fan
tiliga aylantirish haqida qat‘iy talablar bayon qilingan.
Hozirgi kunga qadar o
ʻ
zbek tilshunosligida til nazariyasiga doir fikrlar keng miqyosda tahlil
etildi. Tilshunoslikning nazariy masalalari turli aspektda o
ʻ
rganildi. Ilmiy-nazariy masalalarning
har tomonlama chuqur tadqiq qilinishi turli qarashlar, talqinlarga zamin yaratdi. Bu holat ilmiy
bahs-munozaralarning ayrim masalalar borasida ilmiy tadqiqotlar negizida hanuzgacha davom
etishiga asos bo
ʻ
ldi. Ilmiy bahs-munozaralar maktab, akademik litsey, oliy ta‘lim darsliklariga
ham kirib bordi. Natijada nazariy masalalar talqinida har xil yondashuvlar yuzaga keldi. O
ʻ
zbek
tili imkoniyatlarining o
ʻ
zlashtirilishiga salbiy ta‘sir ko
ʻ
rsata boshladi. Busiz ham o
ʻ
zbek tili
imkoniyatlaridan foydalanish mahoratidan yiroq bo
ʻ
lgan o
ʻ
quvchi-yoshlar grammatik qoidalarni
o
ʻ
zlashtirishda qiynaldilar. Oqibatda ham nazariy qoidalarni o
ʻ
zlashtirish, ham tildan amaliy foy-
dalanish ko
ʻ
nikmalariga ega bo
ʻ
lishda muammolar yuzaga keldi. Muammolarni bartaraf etishda
amaliy lingvistika sohasiga ehtiyoj tug
ʻ
ildi.
―Amaliy lingvistika‖ termini ko
ʻ
p ma‘nolidir. Bu termin rus va g
ʻ
arb tilshunosligida mutlaqo
har xil talqin qilinadi. G
ʻ
arb tilshunosligida
applied linguistics, angewandte linguistik
termini
birinchi navbatda o
ʻ
qitish metodikasini, o
ʻ
qitish maqsadida grammatik tavsif xususiyatlarini
qamrab olgan holda chet tillarini, tilni ona tili va chet tili sifatida o
ʻ
qitish bilan bog
ʻ
lanadi. Rus
tilshunosligida ―amaliy lingvistika‖ termini XX asrning 50 yillarida kompyuter texnologiyalari-
ning ishlab chiqilishi va axborotni qayta ishlash tizimi (boshqaruvning avtomatlashgan tizimi, in-
formatsion qidiruv tizimi, matnni qayta ishlash avtomatik tizimi) shakllanishi munosabati bilan
yuzaga keldi. Shuning uchun ham rus tilidagi adabiyotlarda ―amaliy lingvistika‖ termini o
ʻ
rnida
shu ma‘noda ko
ʻ
p hollarda «kompyuter lingvistikasi», «hisoblash lingvistikasi», «avtomatik ling-
vistika», «injener lingvistikasi‖ terminlari qo
ʻ
llanadi‖ [Baranov,2001:5 ]. Amaliy lingvistikaning
mazkur nomlar bilan yuritilishi uning faoliyati xarakterini belgilaydi. Ushbu terminlarda amaliy
lingvistikaning integratsiyaga asoslanishi, avtomatlashish xususiyati o
ʻ
z ifodasini topgan.
Lingvistik masalalarni hal qilishda matematika, informatikaning o
ʻ
rni ahamiyatli. Matematik
tushunchalarning tilshunoslikka tatbiq qilinishi ma‘lumotlarni o
ʻ
zlashtirishni osonlashtiradi,
xulosalarning aniqligini ta‘minlaydi. Tilshunoslik muammolarining kompyuter yordamida hal
qilinishi esa til funksional doirasining kengayishini, takomillashuvini belgilaydi.
Amaliy lingvistika sohasi sifatida qaralayotgan kompyuter lingvistikasi o
ʻ
zbek tilshunos-
ligida ijtimoiy ehtiyoj talabi bilan yuzaga keldi. Kompyuter lingvistikasi matematika, informa-
83
tika, lingvistika fanlari integratsiyasi asosida shakllandi. ―Kompyuter lingvistikasi‖ inglizcha
«computational linguistics» so
ʻ
zining kalkasidir. XX asrning 80-yillariga qadar bu fan turlicha
nomlar bilan atalgan: hisoblash lingvistikasi, matematik lingvistika, kvantitativ lingvistika, inje-
ner lingvistikasi kabi. Bu fanning asosiy maqsadi lingvistik masalalarni yechishning kompyuter
dasturlarini ishlab chiqish, inson va mashina (kompyuter) muloqotini optimallashtirish, tabiiy
tilni qayta ishlash (Natural Language Processing)dan iborat. NLP kompyuter lingvistikasi tabiiy
tillarning kompyuter analizi va sintezini o
ʻ
z ichiga oladi. Bunda analiz tabiiy tilning komp-
yuterda morfologik, sintaktik va semantik tahlil yordamida tushunilishiga nisbatan ishlatiladi,
sintez esa kompyuterda matnning grammatik shakllantirilishi va generatsiyasi (hosil qilinishi)
demakdir‖ [Rahimov,2011:4]. Kompyuter lingvistikasi tabiiy tillarni qayta ishlash, avtomatik
o
ʻ
qitish, bilimlarni baholash, matnlarni avtomatik tahrirlash, korpus lingvistikasi, avtomatik tar-
jima, mashina orqali tahlil qilish masalalari borasida bahs yuritadi.
Muayyan bir tilning kompyuter lingvistika sohasi rivojlanishi uchun, birinchi navbatda, shu
tildagi ma‘lumotlar bazasi zarur bo
ʻ
ladi. Kompyuter lingvistikasining avtomatik tahrir, avtomatik
tarjima, informatsion qidiruv tizimi, kompyuter leksikografiyasi, til o
ʻ
rgatish dasturlari kabi
barcha yo
ʻ
nalishlari ma‘lumotlar bazasi asosida shakllanadi.
Kompyuter lingvistikasi taraqqiyotini ta‘minlovchi asosiy lingvistik omil elektron matnlar
korpusi yoki parallel matnlar korpusidir. Korpuslar faqatgina lingvistik tadqiqotlar uchun emas,
balki nolingvistik yo
ʻ
nalishdagi izlanishlarga muhim manba sifatida xizmat qiladi. Korpus ling-
vistikasining kommunikatsiya, axborot almashuv, ilmiy tadqiqotlardagi ahamiyatli o
ʻ
rni tadqi-
qotchidan tavsiya qilingan adabiyotlardagi ma‘lumotlarni tahlil qilish, qiyoslash va baho berish
ko
ʻ
nikmalariga, korpus lingvistikasining dasturiy vositalari va axborot resurslari bilan ishlash
malakasiga ega bo
ʻ
lishni talab etadi.
―Korpuslarning bir qator turlari bor: bir muallif korpusi, bir kitob korpusi, milliy korpus.
Milliy korpus til taraqqiyotining ma‘lum bir davridagi xususiyatlari, hududiy va sotsial variant-
lari – barcha jihatlarini qamragan holda namoyon etishdir. Rus tilining milliy korpusi internet
tizimida 2003- yildan beri amal qilib kelmoqda va hozirgi vaqtda 149 mln so
ʻ
z qo
ʻ
llanishiga ega
bo
ʻ
lgan har xil ruscha matnlarni o
ʻ
z ichiga olgan. Istiqbolda rus tilining milliy korpusi 200 mln
so
ʻ
z qo
ʻ
llanishini o
ʻ
z ichiga olgan matnlardan iborat bo
ʻ
lishi ko
ʻ
zda tutilgan [http://ruscorpora.ru;
http://ruscorpora.ru].
Keyingi yillarda internet tizimining rivojlanishi virtual matnlar korpusining yuzaga kelishiga
olib keldi. Internetdagi qidiriv saytlari, elektron kutubxonalar, virtual ensiklopediyalar korpus
vazifasini bajarmoqda. Korpusning janri va tematik rang-barangligi internetdan foydalanuv-
chining qiziqishlariga bog
ʻ
liq. Masalan, ilm-fan doirasida ―Wikipedia‖ katta hajmdagi matnlar
korpusi sifatida foydalanilmoqda [http://www.wikipedia].
Korpus lingvistikasida parallel matnlar korpusi muhim ahamiyat kasb etadi. Parallel matnlar
korpusi badiiy asar, qo
ʻ
llanma, ommaviy axborot vositalari, turli xil hujjatlarning ikki yoki undan
ko
ʻ
p tillardagi elektron ko
ʻ
rinishlaridir. Parallel korpuslar yordamida bir so
ʻ
z, jumla, abzas,
supersintaktik butunliklarning turli tillardagi variantlarini bilish mumkin. Parallel korpuslar
madaniyatlararo muloqot keng yoyilgan hozirgi davr uchun muhim voqelik hisoblanadi.
Parallel matnlar korpusining shakllanishi o
ʻ
zbek tilining nufuzini oshirish, mavqeyini mus-
tahkamlashga xizmat qiladi. Avvalo, parallel matnlar korpusi ma‘lumotlar bazasi sifatida kom-
munikativ funksiya bajaradi. Bir tildagi matnning boshqa tildagi tarjimasi madaniyatlararo mu-
nosabatlarni aniqlashga, farqlarni ko
ʻ
rsatishga yo
ʻ
naltiriladi. Leksik birliklarni boshqa tillardagi
tarjima variantlari orqali semantik tahlil qilishga imkoniyat yaratiladi. Axborot uzatishning turli
tillardagi umumiy va spetsifik xususiyatlari aniqlanadi.
84
Do'stlaringiz bilan baham: |