Annotation:
This article describes the linguistic principles of creating an automatic
editing program. At the same time, due to the peculiarities of the Uzbek language, attention is
paid to the factors that ensure the perfect operation of the automatic editing program.
Key words:
automatic editing, principles of automatic editing, logical-mathematical
methods of information methods, negation, conjunction, disjunction, theoretical-information
methods, probability-statistical methods.
Umumiy nazariy tilshunoslik asoschisi hisoblangan tilshunos olim Vilgelm Fon Gumbolt
til va xalq birligini shunday ta’riflagan edi: “Xalq tilida uning ongi bor, xalq ongida esa uning
tili. Ularning oʻzaro bogʻliqligini bundan ortiq koʻrsatib boʻlmaydi”. Ana shunday murakkab
hodisa boʻlgan aloqa qurolini – tilni murakkab sistema sifatida tadqiq va tahlil qiluvchi
tilshunosik fanida XXI asrga kelib yangidan yangi yoʻnalishlar, sohalar paydo boʻla boshladi.
Paralingvistika, psixolingvistika, sotsiolingvistika, etnolingvistika, kognitiv lingvistika,
neyrolingvistika, kompyuter lingvistikasi kabilar yoʻnalishlar vujudga keldiki, tilshunoslikning
tadqiqot obyektlari yangicha mazmun kasb eta boshladi va amaliyot bilan bevosita bogʻliqlik
kasb etdi. Kompyuter lingvistikasi yangi fan tarogʻi sifatida 1950-yillarda Amerika Qoʻshma
Shtatlarida paydo boʻldi. Tranzistorning ixtiro qilinishi, kompyuter yangi avlodlarining paydo
boʻlishi, tillarning ilk marotaba dasturlanishi mashina tarjimasi bilan bogʻliq tajribalarni boshlab
berdi. Kompyuter lingvistikasiga oid ilk tadqiqotlar, keyinchalik uning muhim tarmogʻiga
aylangan mashina tarjimasi boʻyicha olib borilgan.1960-yillarda ana shunday tekshirish
Rossiyda oʻtkazilgan (masalan, 1964-yil “Kibernetika muammolari” toʻplamiga rus tilidan
arman tiliga tarjima haqidagi maqola bor).
Kompyuter lingvistikasi hozirgi vaqtda nazariy va amaliy fan sifatida toʻla shakllanib
bormoqda. Uning nazariy fan ekanligi nutqiy jarayonni, matnni oʻrganishning turli xil model
*
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti oʻqituvchisi
540
(gipoteza)larini yaratishning nazariy asoslarini ishlab chiqishida koʻrinadi. Uning amaliy
xususiyati esa tarjima mashinalarini yaratish va uning ishlash jarayonini tashkil etishi bilan
belgilanadi. Buning uchun kompyuter lingvistikasi fani quyidagi uch usul va metodlardan keng
foydalanadi:
mantiqiy-matematik usullar: masalan, inkor amali, konyunksiya, dizyunksiya amallari
kabilar;
nazariy-informatsion usullar;
ehtimollik-statistik usullari.
Kompyuter lingvistikasining ana shunday nazariy va amaliy asoslarini belgilashda
Daniya olimi L.Elmslev, amerikalik olimlar N.Xomskiy, K.Shenon kabilarning xizmati kattadir.
Kompyuter lingvistikasining amaliy muammolari XX asrning oʻrtalarida vujudga keldi.
Bu narsa birinchi navbatda mashina tarjimasi (MT) bilan aloqadordir. 1954-yilda AQSHda IBM
– 701 rusumli tarjima qurilmasi yaratildi va bu qurilma 250 ta soʻzdan iborat 60 ga yaqin ruscha
gaplarni ingliz tiliga tarjima qilish jarayonini amalga oshirdi. Bu ishga P.Gavren, L.Dostert,
P.Sheridanlar ishtirok etdilar.
1955-yilga kelib sobiq Ittifoqda BESM rusumli mashina qurilmasi yordamida inglizcha
gaplarni rus tiliga tarjima qilish jarayoni amalga oshirildi (I.K.Belskaya, L.N.Korolev,
S.N.Razumovskiy kabilar). Shundan keyin jahonning Angliya, Fransiya, Avstriya kabi koʻpgina
mamlakatlarida olimlar mashina tarjimasi muammolari bilan maxsus shugʻullana boshladilar.
Natijada tilshunos olimlar ma’lum bir tilni tipologik jihatdan tasniflash, uning materiallarini
analiz va sintez qilish, mashina tiliga oʻtkazish bilan shugʻullandilar va muayyan natijalarga
erishdilar.
Bunday muammolarni lingvistiktadqiqotlarni avtomatlashtirish orqali hal etish mumkin.
Bu masalaga doir tilshunoslarning maxsus ilmiy anjumanlari oʻtkazilgan. Masalan, 1962-yilda
Kembridj shahrida jahon tilshunoslarining 1X-kongressi oʻtkazildi. Bu anjumanda structural
tilshunoslik (ST) va ML muammolarini muhokama qilishga alohida oʻrin ajratilgan edi.
1967-yilda Buxarest shahrida jahon tilshunoslarining X kongressi oʻtkazilib, bunda ham
kompyuter lingvistikasi va MT muammolari maxsus muhokama qilindi. 1960-yilda Parij
shahrida xalqaro kongress oʻtkazilib, bunda maxsus algoritmik til – ALGOL joriy etilgan edi. Bu
algoritmik til hozirgi kunga qadar EHMga matnlarni kiritish, ularni dasturlash uchun xizmat qilib
kelmoqda.
1996-yil 20-21-mayda Samarqand shahrida sohibqiron Amir Temurning 660 yilligiga
bagʻishlangan “Injenerlik tilshunosligi va til oʻqitish jarayonini kompyuterlashtirish”
muammolariga doir 2-xalqaro ilmiy anjuman oʻtkazildi. Bu anjumanni akademik
R.G.Piotrovskiy “Injenerlik tilshunosligi va mustaqil davlatlarda informatsion industriyaning
tiklanishi” mavzuidagi ma’ruzasi bilan boshlab berdi. Shuningdek, bu anjumanda “Turkiy tillar
mashina fondining dolzarb masalalari”, “Injenerlik tilshunosligi va lugʻatshunoslik”, “Nutq
sistemasi va uning unsurlarini kompyuter yordamida andozalash” singari oʻttizdan ortiq
qiziqarli ma’ruzalar tinglandi hamda muhokama qilindi. Bu anjuman materiallari alohidatoʻplam
shaklida nashr etilgan.
XX asrning 80-yillaridan boshlab til oʻqitishni avtomatlashtirish va unga kompyuterni
joriy etish muammolariga qiziqish kuchaydi. 1988-yilda R.G.Piotrovskiyning “Chet tilini
oʻqitishda kompyuterlashtirish masalalari” nomli asari nashr etilgan edi [Пиотровский Р.Г.
1988.3-75]. Bu asar “Kirish” va “Xulosa”dan tashqari besh bobni oʻz ichiga oladi. Asar
boblarining nomlanishi quyidagicha:
1. Tabiiy til va uning didaktik modeli (4-15-betlar);
2. Inson miyasi va kompyuter “miyasi” (15-24-betlar);
3. Kompyuter yordamida lingvodidaktik masalalarni yechishning tamoyillari (24-44-betlar);
4.Nutqiy va til materialini tanlash hamda tillarni oʻqitishni optimizatsiyalash (44-58-betlar),
5. Til oʻrgatuvchi lingvistik avtomat va tillarni oʻqitishni optimizatsiyalash (58-73-betlar).
541
Tilshunoslikda
EHMning
qoʻllanilishi
avtomatik
tarjima
muammolari
bilan
shugʻullanish, mashina yordamida matn tuzish, uni qisqartirish, sintezlash jarayonini amalga
oshirish uchun keng imkoniyatlar yaratdi. Natijadamashina til materiallarini formallashtirish,
chastotali lugʻatlar tuzish, turli qisqartmalar va simvollardan foydalanish, MT algoritmini tuzish
bilan shugʻullanmoqda.
Keyingi yillarda mamlakatimizda kompyuter lingvistikasi muammolariga oid ayrim
ishlar yaratildi. Bu oʻrinda S.Muxamedov va R.G.Piotrovskiy [Мухамедов С.А., Пиотровский
Р.Г. 1986:164], A.K.Poʻlatov [Пулатов А.К., Жураева Н. 2002:47-54, 2003:45],
S.Muxamedova [Muhamedova S. 2004:77-81, 2007:74] , S.Rizayev [Rizayev S.
2006:74] kabi
olimlarning ishlarini alohida ta’kidlash lozim.
Tilni algoritmik jihatdan tasvirlash jarayoni matnni analiz va sintez qilishni taqozo etadi.
Bu esa “mazmun - matn” muammosi faqatsof lingvistik muammo boʻlib qolmay, balki matnni
bir qator logik-matematik interpretatsiya (sharhlash) qilish jarayonini ham taqozo etuvchi
murakkab muammo ekanligini koʻrsatadi. Bu jarayonlarning barchasi matematik mantiq (logika)
elementlari bilan aloqadordir.
Kompyuter lingvistikasi sun’iy intellektni yaratishda tirik mavjudotlar va
insonlardagi intellektual jarayonlarni matematik va kompyuter modelini tuzuvchi fan
tarmogʻi boʻlib, uning markazida tabiiy tillar ifodasining matematik modellaridan
foydalanish turadi. Bu soha qisman tabiiy tillarni qayta ishlash bilan kesishadi. Soʻnggi
urgʻu mavhum modellarga emas, kompyuter tizimi uchun tillarning qayta ishlangan va
ularning ifodasidagi amaliy metodlarga beriladi. Kompyuter lingvistikasi tadqiqotchilarining
faoliyati til ma’lumotlarini qayta ishlash uchun amaliy dasturlar va algoritmlar
ishlanmasini yaratish hisoblanadi.
Bugungi kunda tilshunoslikda kompyuter orqali bajariladigan ishlar bir muncha koʻpaydi.
Shuningdek, foydalanuvchiga qulaylik yaratuvchi lingvistik dasturlarga talab yanada oshib
bormoqda. Bunga sabab informatsion olamning kengayishi va insonlarning qulaylikka hamda
tezkorlikka intilishi deb baholashimiz mumkin. Kompyuter yordamida orfografik, tarjima
dasturlari, sinonim, antonim, omonim lugʻatlarini yaratish, matnlarni avtomatik ravishda tarjima
qilish, matnlarni toʻgʻri tahrir qilish, hujjatlarni tahlil qilish, ma’lumotlar bazasini ishlab chiqish
lingvistik modellar asosidagi mukammal dasturlarni yaratishni taqozo etmoqda. Buning
natijasida sun’iy intellekt boʻlmish kompyuterga va uning intellekt darajasini oshirib boruvchi
insonga nisbatan “Inson-kompyuter”, “kompyuter-Inson” birikmalari paydo boʻldi. Kompyuter
lingvistikasi
boʻyicha
yirik
mutaxassis
Abdumajid
Poʻlatov
lingvistika+matematika+kompyuter birligida ishlash lozimligini aytar ekan, quyidagi ishlarni
amalga oshirish zarurligini ta’kidlab oʻtadi:
Tilni (oʻzbek tilini) sistemalash, toʻliq ma’lumotlar bazasini yaratish va uni dunyo
tili (ingliz tili) bilan qiyoslash.
Fanning boshqa sohalariga ham xizmat qiladigan oʻzbek tilining aniq, qisqa va
xalqaro me’yorlarga asoslangan axborot uslubini yaratish.
Oʻzbek tili grammatikasining formal va aksiomatik modellarini yaratish.
Oʻzbek tilida bajariladigan kompyuter dasturlarini yaratish.
Xorijda va Rossiyada kompyuter lingvistikasiga oid tadqiqotlarning koʻlami keng.
Oʻzbekistonda esa bu soha rivojlanish bosqichida turibdi. Shunday ekan, oʻzbekkompyuter
lingvistikasi oʻz shakllanish tarixiga ega, uning kelajagi bor.
Barcha davrlar ilm-fan oldiga oʻz talabini qoʻyadi. Fanning asosiy vazifasi mavjud
holatni tanqid qilish, yangi bosqichga koʻtarish, yangi yoʻnalishlar ochish, ertangi kun
imkoniyatlari va talablariga mos ravishda rivojlantirishdir [Пўлатов А. 2011:6]. Kompyuter
lingvistikasi ham yangi paydo boʻlgan fan tarmogʻi sifatida oʻzbek tilshunosligi oldiga
qator muhim vazifalarni qoʻyadi:
oʻzbekcha imlo, tezaurus, omonimlar lugʻatining kompyuter dasturlarini yaratish;
542
oʻzbek tilini chet tili sifatida oʻrganuvchilar uchun mukammal dasturlar yaratish;
turli tillardagi matnlarni oʻzbek tiliga imkon boricha sifatli tarjima qiluvchi
kompyuter dasturlarini yaratish;
matn tahririda orfografik, punktuatsion xatolarni aniqlovchi kompyuter dasturining
oʻzbek tilidagi variantini yaratish.
Do'stlaringiz bilan baham: |