KORPUS LINGVISTIKASI VA KOMPYUTER LINGVISTIKASI
Reja:
1. Korpus lingvistikasi nima
2. Kompyuter lingvistikasi nima
3. Bu ikki sohaning olimlar tomonidan oʻrganilishi
4. Korpus lingvistikasi va kompyuter lingvistikasining bir-biridan farqli jihatlari
Korpus lingvistikasi - kompyuter lingvistikasining boʻlimi
boʻlib, kompyuter texnologiyalari yordamida til korpuslarini
yaratish va qoʻllash muammolari bilan shugʻullanadi.
Bu sohaning predmeti korpus yaratish nazaryasi va amaliyoti
boʻlsa, fan sifatida korpusning uziga xosligi, dasturlash
asoslari kabi jihatlari oʻqitiladi.
Korpus tilshunosligi oʻz materiallarini yaratadi, aniqrogʻi, uni mustaqil ravishda tuzadi. Bu esa, mustaqil tilshunoslikni oʻz ichiga oladi - u ishlatilgan ogʻzaki materiallarning oʻziga xos xususiyati va vositalari, ya'ni korpuslar tahlili uchun dasturlarga egadir. Ilm-fanning mustaqilligi tahlili materiallari yoki tadqiqot usullari mavjudligi bilan belgilanadi. Korpus tilshunosligi unisiga ham, bunisiga am ega.
“Kompyuter lingvistikasi - kompyuter texnologiyalardan til faoliyatlarini modellashtirishda ma'lumotlar yigʻish, saralash va keng koʻlamda foydalanishdir. Ba'zi muammoli vaziyatlarga koʻra, tilning kompyuter modeli nafaqat tilshunoslikda, balki u bilan chambarchas bogʻliq boʻlgan fanlarda ham qoʻllash nazarda tutiladi” .
Tilshunoslik nuqtayi nazaridan yondashsak, kompyuter lingvistikasining paydo boʻlishi bugungi kunda fanning bir qancha muammolariga yechim topish imkoniyatini beradi. Kompyuter texnologiyalarini tilshunoslikning ilmiy-nazariy, falsafiy muammolari: til va nutq, sistema va struktura, semiotika, sintagmatika va paradigmatika, tipologiya, lugʻatshunoslik kabi muhim hamda murakkab masalalari boʻyicha olib borilayotgan ilmiy tadqiqotlarda qoʻllashning ijobiy tomonlariga tayangan holda korpus lingvistikasi sohasi yaratildi.
Ba'zi olimlar esa korpus lingvistikasini kompyuter lingvistikasi qamrovidagi soha deya e'tirof etishadi: Kompyuter va korpus lingvistikasi bir-biriga oʻxshash va ba'zi hollarda bir xil degan notoʻgʻri qarashlar uchrab turadi. XX asrning 90-yillari birinchi yarmida korpus tilshunosligi til toʻgʻrisidagi fanning alohida qismi sifatida shakllandi. Shu bilan birga, u kompyuter tilshunosligi bilan yaqindan hamkorlik qilladi, uning yutuqlaridan foydalanadi va, oʻz navbatida, uni boyitadi.
Korpus lingvistikasining nazariy va amaliy tomonlama muhim boʻlgan muammolari chet el olimlari tomonidan oʻrganilgan va ular quyidagilar: I.F.Ganiyeva korpus lingvistikasiga oid terminlarning ishlatilishi yuzasidan oʻz qarashlarini ifoda etgan, J.Sinkliyer esa korpus lingvistikasidan foydalanishning ahamiyatli tomonlarini muhokama qilgan. D.Biber, S.Konrad va R.Reppenlar korpus lingvistikasining til oʻrganishdagi oʻrnini tadqiq qilishgan, H.Lindkvist, N.Lich, N.S.Dash, F.Meyer, T.Grays, F.Karen, S.Ҳunston, T.Mk Eneriy, Z.Xiao, Yu.Tono, A.Vilson va boshqalar mazkur muammoni turlicha yondashuv asosida oʻrganishgan. Ushbu sohada oʻzbek tilshunosligida sezilarli darajada tadqiqot olib borilmagan.
Kompyuter lingvistikasi ham oʻz muammo hamda yutuqlari nuqtayi
nazaridan oʻrganib chiqilgan. A.N.Baranov oʻz ishlarida sun'iy ong
muammosini ochib berishga toʻxtalgan, B.Orexov semantik analiz,
texnik tarjima va avtomatik morfologiya tomonidan fanni oʻrganib
chiqqan boʻlsa, I.A.Chesebiyev kompyuter lingvistikasining
metodlari rivojlanish tarixini oʻrganib chiqqan. Shu oʻrinda,
N.Xomskiy (Chomsky)ning sintaktik strukturalar va universal
grammatika nazariyasi fan rivojiga katta hissa qoʻshgan. Ch.Filmor
(Fillmore) esa ushbu nazariyaga qoʻshimcha sifatida tillardagi predlog
kabi nooʻxshashliklar va ularning til strukturasida boshqa
tushunchalar orқali ifoda etilishi nuqtayi nazardan yondashgan.
U.Vuds (Woods)2 fanga protsessual semantika gʻoyasini kiritdi.
Kompyuter tilshunosligi korpus tilshunosligi uchun vositalarni (ya'ni dasturlarni) yaratadi. Shu ma'noda ular bir-birini tўldiradilar.
Kompyuter tilshunosligini қўllashning ayrim jiҳatlari қuyidagilar:
1. avtomatik tarjima;
2. autentik va yarim-autentik matnlardan avtomatlashtirilgan ma'lumotlarni olish;
3. inson va mashina ўrtasida qulay interfeyslarni yaratish;
4. tabiiy tillarda aloqaning kantitatif tavsifi.
Kompyuter lingvistikasi korpus lingvistikasidan quyidagi xususiyatlariga koʻra bir-biridan keskin farqlanadi.
Nomlanishi jixatlaridagi farq:
mazkur ikki sohaning belgilangan maqsadlari jihatidan:
a) kompyuter lingvistikasi tilga oid programmalarni ishlab chiqishni oʻz oldiga asosiy maqsad qilib qoʻyadi. Ta'kidlash joizki, bu bevosita tilshunoslik oldidagi muamolarni hal etishga qaratilmagan;
b) korpus lingvistikasi esa, fanning maqsadi sifatida mavjud tilning korpusini yaratish va uning yordamida tildagi soʻzlar, iboralar hamda boshqa lisoniy birliklarning qoʻllanilish chastotasini aniqlashni belgilab qoʻygan. Bu esa korpus lingvistikasini aynan tilshunoslikka oid ekanligini koʻrsatadi.
3) kompyuterning barcha fanlarda foydalanish oʻrni va ahamiyati tomonidan:
a) kompyuter lingvistikasida kompyuter qurilmalari asos boʻlib, ushbu fandagi barcha izlanishlar kompyuterlar va ularning afzalliklarini oshirishga qaratiladi;
b) korpus lingvistikasi esa kompyuter qurilmalaridan faqatgina vosita sifatida foydalanadi, bunda matnlarni yigʻish va saralash amaliyotlarini bevosita ular yordamida amalga oshiradi.
Foydalanilgan Adabiyotlar:
1. Baranov A.N. Kompyuter lingvistika
2. Baranov A.N. M.: Editorial URSS, 2001. - 360 s.
3. Mamontova V.V. Korpus lingvistika.h
4. www.myfilology.ru
Do'stlaringiz bilan baham: |