Tadqiqotning obyekti sifatida jadid tilshunoslaridan biri Abdurauf Fitratning lingvistik asarlari tanlandi.
Tadqiqotning predmetini milliy korpus yaratishda lingvistik baza, korpus birliklari, korpus razmetkasini modellashtirish, lemma va teglar tashkil etadi.
Tadqiqotning ilmiy yangiligi quyidagilardan iborat:
o‘zbek tilidagi so‘zshakllarni, leksik birliklarni grammatik tavsiflash asosida o‘zbek tili milliy korpusini yaratish texnologiyasi, milliy korpusda ma’lumotlarni taqdim etish tamoyillari nazariy jihatdan asoslangan;
milliy korpus razmetkasining SGML/XML tiliga asoslangan mavjud standartlari modellashtirish yo‘llarini tartibga soluvchi oddiy matn, sarlavha oid qoliplar nazariy xulosa asosida dalillangan;
o‘zbek tili milliy korpusining lingvistik bazasini to‘ldiruvchi matnlarni razmetkalash formati, leksik ma’lumotni kodlash talablari hamda so‘z birikmasi, qo‘shma so‘z yasalishida lingvistik modellardan foydalanish imkoniyati aniqlangan;
o‘zbek tili milliy korpusining lingvistik bazasini to‘ldiruvchi matnlarni tayyorlash jarayonida: matnni oldindan qayta ishlash, uni belgilash, korpusga kirishni ta’minlash, ularni tez ravishda ko‘p parametrli qidirish va statistik ishlov berish kabi bosqichlar orqali korpus-menejer tizimi hamda korpus interfeysini shakllantirish nazariy jihatdan asoslangan.
Tadqiqot natijalarining ilmiy va amaliy ahamiyati. Tadqiqot natijalarining ilmiy ahamiyati o‘zbek tili milliy korpusini yaratish, kompyuter lingvistikasi yo‘nalishidagi tadqiqotlarning yuzaga kelishi, o‘zbek tilining internet tizimidagi elektron-ma’lumotlar bazasi sifatidagi taraqqiyotini tadqiq etishga oid nazariy xulosalardan tilshunoslik yo‘nalishlaridagi ishlarda manba sifatida foydalanish mumkinligi bilan belgilanadi.
Tadqiqot natijalarining amaliy ahamiyati ishdagi nazariy umumlashma va tahlillardan «Kompyuter lingvistikasi» laboratoriyasini yaratish, «Kompyuter lingvistikasi», «Mashina tarjimasi», «Korpusga asoslangan tarjimashunoslik» kabi maxsus kurslarni o‘qitish, o‘zbek tilining xalqaro miqyosdagi maqomini oshirish, uni jahon muloqot tili darajasiga ko‘tarish, o‘zbek tilini chet ellarda o‘rganish va o‘rgatish, milliy tilimizning imkoniyatlarini kengaytirish hamda sayqallash ishlari orqali milliy korpus tuzishda foydalanish mumkinligi bilan izohlanadi.
I BOB. MILLIY KORPUS – O‘ZBEK TILINING ELEKTRON LINGVISTIK MANBASI SIFATIDA
Do'stlaringiz bilan baham: |