Reja:
Kirish.
I bob. Milliy korpus – o‘zbek tilining elektron lingvistik manbasi sifatida.
1. 1. Korpus lingvistikasida korpus terminiga oid ma’lumotlar tahlili.
1. 2. O‘zbek tilshunosligida milliy korpusning ahamiyati.
II bob. Lingvistik korpus tuzishning umumiy tamoyillari va ma’lumotlarni tayyorlash texnologiyasi.
2. 1. Lingvistik korpus tuzishning umumiy qoidalari.
2. 2. Lingvistik korpusda ma’lumotlarni taqdim etish tamoyillari.
2. 3. Lingvistik korpus uchun matn tayyorlash texnologiyasi.
III bob. O‘zbek tili milliy korpusida jadid tilshunoslarining lingvistik asarlari bazasini shakllantirish.
3. 1. Lingvistik korpusda reprezentativlik.
3. 2. Matnlarni razmetkalash.
Xulosa.
Foydalanilgan adabiyotlar.
KIRISH
Dissertatsiya mavzusining dolzarbligi va zarurati. Jahon tilshunosligida XXI asrning ikkinchi o‘n yilligiga kelib muayyan tilni saqlab qolishning, uning o‘rganilish doirasini kengaytirishning, til imkoniyatlarini namoyon etishning asosiy vositasi internet tizimida til korpuslarini o‘rganishga alohida e’tibor qaratilmoqda. Jumladan, bugungi kunda XX asrning buyuk kashfiyoti bo‘lgan kompyuter texnologiyalari, o‘z navbatida, boshqa sohalar kabi tilshunoslik fani uchun ham keng imkoniyatlar eshigini ochishi hamda uning zimmasiga kompyuter tili bilan bog‘liq ulkan vazifalarni yuklashi, kompyuter lingvistikasi yo‘nalishining paydo bo‘lishi tabiiy tillarning taraqqiyoti uchun muhim ahamiyat kasb etadi.
Dunyo tilshunosligida tilni lingvistik modellashtirish, so‘zlarni lemmalash va teglar algoritmini yaratish hamda milliy-madaniy merosdan foydalanish imkonini oshirish maqsadida muayyan tilda yaratilgan og‘zaki, yozma yodgorliklar, ma’naviy meros namunalarini elektronlashtirish ishlari qizg‘in tus oldi. Kompyuter texnologiyalari vositasida axborotni qayta ishlash, axborot-resurslarni joriy etish uchun zarur dasturiy hamda metodik ta’minotni yaratish, internet tizimida til korpusini va shu asosda milliy til korpusining ilmiy-nazariy jihatlarini ishlab chiqishga alohida diqqat qaratilmoqda.
O‘zbek tilshunosligida avtomatik tarjima qilish, mualliflik korpusining lingvistik asoslarini ishlab chiqish, leksikografik matnlarga ishlov berish va lingvostatistik tahlil etish borasida bir qator tadqiqot ishlari amalga oshirilmoqda. Jumladan, “...davlat tilining sofligini saqlash, uni boyitib borish va aholining nutq madaniyatini oshirish; davlat tilining zamonaviy axborot texnologiyalari va kommunikatsiyalariga faol integratsiyalashuvini ta’minlash”1ga alohida e’tibor qaratildi. O‘zbek tilining xalqaro miqyosdagi maqomini oshirish, uni jahon muloqot tili darajasiga ko‘tarish, o‘zbek tilini chet ellarda o‘rganish va o‘rgatish, milliy tilimizning imkoniyatlarini kengaytirish va sayqallash ishlari ham bevosita milliy korpus orqali qulay amalga oshishini nazarda tutsak, «o‘zbek tili milliy korpusini yaratishning nazariy va amaliy masalalari»ni hal etish dolzarblik kasb etadi. Shu ma’noda, matn korpusi hamda milliy korpusning lingvistik asoslari, uning dasturiy ta’minotini yaratish texnologiyasi yuzasidan ilmiy tadqiqotlarni yanada chuqurlashtirish zarurati mavjud.
O‘zbekiston Respublikasi Prezidentining 2016-yil 13-maydagi PF-4997-son «Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universitetini tashkil etish to‘g‘risida», 2017-yil 7-fevraldagi PF-4947-son «O‘zbekiston Respublikasini yanada rivojlantirish bo‘yicha Harakatlar strategiyasi to‘g‘risida», 2019-yil 21-oktyabrdagi PF-5850-son «O‘zbek tilining davlat tili sifatidagi nufuzi va mavqeyini tubdan oshirish chora-tadbirlari to‘g‘risida»gi farmonlari, 2017-yil 17-fevraldagi PQ-2789-son «Fanlar akademiyasi faoliyati, ilmiy tadqiqot ishlarini tashkil etish, boshqarish va moliyalashtirishni yanada takomillashtirish chora-tadbirlari to‘g‘risida», O‘zbekiston Respublikasi Vazirlar Mahkamasining 2019-yil 12-dekabrdagi 984-son «Davlat tilini rivojlantirish departamenti to‘g‘risidagi Nizomni tasdiqlash haqida», 2020-yil 29-yanvardagi 40-son «O‘zbekiston Respublikasi Vazirlar Mahkamasi huzuridagi Atamalar komissiyasining faoliyatini tashkil qilish chora-tadbirlari to‘g‘risida»gi qarorlari hamda sohaga oid boshqa me’yoriy-huquqiy hujjatlarda belgilangan vazifalarni amalga oshirishda ushbu dissertatsiya muayyan darajada xizmat qiladi.
Jahon kompyuter lingvistikasida korpusni tuzish, o‘rganish korpus lingvistikasi sohasi rivojlanishidan ancha oldin boshlangan. Chunonchi, XVIII asrlarda Bibliyaga oid tadqiqotlar (mas., Cruden), lug‘atlar (Johnson, Oxford English Dictionary, Webster Dictionary), tillarni o‘qitish (частотный корпус Thorndike'а, 1921), Kvirk korpusi (Survey of English Usage) shular jumlasidandir. Birinchi korpus AQShdagi Braun Universitetida 1960-yillarda yaratilgan Braun korpusi (Brown Corpus)dir. Braun tamoyillari bo‘yicha yaratilgan Uppsala Korpusi (Uppsala Universiteti, Shvetsiya) bo‘lsa, Buyuk Britaniyada Angliya Bank loyihasi (Bank of English) va Britaniya milliy korpusi (BNC) vujudga keldi. Britaniya tamoyillari asosida ko‘plab Yevropa tillarining (ispan, italyan, xorvat) milliy korpuslari yaratildi. Tabiiy tillarning formalizatsiyasi va ularning protsessorlarini matematik apparatlar asosida kompyuter modellarini yaratish masalalari bo‘yicha Naum Xomskiyning tadqiqotlari amalga oshirilgan. Charlotte Taylor korpusning umumiy va maxsus turlari mavjudligi, maxsus turdagi korpuslar janr, uslub, davrlarga ko‘ra farqlanishi, har ikki turdagi korpus, o‘z navbatida, diaxron va sinxron shaklida bo‘lishini qayd etgan.
Bugungi kunda jahon tilshunosligida milliy korpuslarni yaratish bo‘yicha qator, jumladan, quyidagi ustuvor yo‘nalishlarda tadqiqotlar olib borilmoqda: Polsha milliy korpusi, Alma-ata qozoq tili korpusi, Sharqiy arman korpusi, Tojik tili milliy korpusi va hokazo. Charlz Meer (Cambridge University Press , 2004) korpus lingvistikasida tadqiqot olib borayotgan muayyan kichik doiradagi tadqiqotga doir metodologik usulni ham korpus deb nomlash mumkinligi taklif etadi. Dougles Biber (Oxford university, 2015) korpus analitik texnologiyaning miqdor (statistik) va sifat xususiyatlarini o‘z ichiga olishi kerakligini ta’kidlaydi. M.Z.Kurdi (Great Britain, 2016) korpuslarning tematik ko‘lamini matnlarning sohaviy tasnifiga ko‘ra muvozanatlashgan, imkoniyat darajasidagi korpus turlariga ajratadi.
Do'stlaringiz bilan baham: |