O‘zbekiston respublikasi oliy va o‘rta maxsus ta’lim vazirligi o‘zbekiston milliy universiteti jurnalistika fakulteti


Turkologiyada lingvistik korpuslarning o‘ziga xos jihatlari tadqiqi



Download 0,58 Mb.
bet4/5
Sana18.12.2022
Hajmi0,58 Mb.
#890733
1   2   3   4   5
Bog'liq
Kurs ishi. UrazaliyevaM.Y

Turkologiyada lingvistik korpuslarning o‘ziga xos jihatlari tadqiqi

Til – ijtimoiy hodisa. Shu sababli amalga oshiriladigan ishlar sirasiga kiruvchi shevalar platformasi tildagi o‘zgarishlar oqibatida qayta ishlanishi yoki sayqallanib borishi natijasida mukammal holatga keladi. Chunki kommunikativ birlik hisoblanmish matn ham til bilan bog‘liq holda o‘zgaruvchandir. Korpus yaratuvchilarining vazifasi – korpus yaratilayotgan tilning pastki qismiga oid iloji boricha ko‘proq matnlarni to‘plash. Ammo asosiy narsa nafaqat lingvistik materialning hajmida, balki uning mutanosibligidadir.
Turkologiyada korpus yaratish XX asr o‘rtaalrioga kelib boshlangan bo‘lsada, uning rivovlanishi hozirgi asrga mos keladi. Yaqin yillardan buyon “Turklang” konferensiyasi o‘tkazilib kelinmoqda va undagi asosiy masala tillarning rivoji yo‘lida barcha imkoniyatlarni ishga solish, korpuslar va tezauruslar yaratish, avtomatik tarjima uchun yetarlicha manba yaratishdan iborat. Mana shu konferesniya doirasida turli xalqlardan professor-olimlar qatnashib, tarjima vas hu kabi muammolarga yechim izlashadi. Turklang.net platformasida o‘tkaziladigan konferensiya haqida ma’lumotlar topish, ularni o‘rganish, bundan tashqari ushbu manzil orqali turli elektron korpuslarga ham kirish mumkin. Bu elektron korpuslar doirasida mualliflik, parallel va multimediyali korpuslar ham mavjud.
Boshqird she'riyat korpusida 1,8 million so'zdan ko'proq hajmdag taxminan 450 ming she'riy satr, 101 shoirning 17 mingdan ortiq she'rlar mavjud. Bu dunyodagi ikkinchi (rus tilidan keyin) she'riy korpus. Uning o'ziga xosligi shundaki, matn to'plami XX asr va XXI asr boshlari boshqird shoirlarining she'riy asarlaridan iborat.
Sharqiy Armaniston Milliy Korpusining (EANC) qidiruv tizimi korpus uchun moslashtirilgan. Korpusni ishlab chiqish Boshqird davlat universitetining Hisob filologiyasi laboratoriyasi xodimlari tomonidan Rossiya Fanlar akademiyasi Tilshunoslik instituti Jahon she'riyati lingvistik tadqiqotlar markazining axborot va ma'naviy yordami bilan amalga oshiriladi. Konsultativ yordam va loyihani har tomonlama qo'llab-quvvatlash tegishli a'zo tomonidan amalga oshiriladi. Korpusdagi matnlar morfologik belgilar bilan ta'minlangan, bu alohida so'zlarning qo'llanilishiga tegishli belgilar to'plami, shuningdek, ma'lum bir metr bilan yozilgan satrlarda, qofiya zonasida va hokazolarni qidirish imkonini beradigan maxsus she'riy belgi. Foydalanuvchiga ko'rsatilgan matnlardagi so'zlar rus tiliga tarjimaga ega bo'lib, bu tizim bilan nafaqat boshqird tilining ona tilida so'zlashuvchilari, balki umumiy filologlar, versifikatorlar va lingvist-tipologlar uchun ham ishlash imkonini beradi. So'z shakllarini grammatik tahlil qilish avtomatik ravishda amalga oshiriladi. Bashmorf avtomatik morfologik tahlil tizimi B. V. Orexov va A. A. Gallyamovlar tomonidan ishlab chiqilgan.
Keying korpus “Qrim-tatar tilining lingvistik korpusi”. Zamonaviy Qrim-tatar yozma tilining korpusi. Korpus XXI asr boshlarida nashr etilgan gazeta matnlaridan iborat. Qo'shimcha elektron matnlar to'plamiga asoslangan ma'lumotlar so'rovi tizimidir. Korpus ma'lum bir davrda tilning ustunligi va darajasining ifodasidir. Tilshunoslar (tilshunoslar) lingvistik korpusni ilmiy tadqiqot va til o'qitishda birinchi o'ringa olib chiqadilar.
“Bugungi kunda biz yangi O‘zbekistonni, yangi Renessans poydevorini barpo etishdek ezgu maqsadlarimizga erishishda, hech shubhasiz, ona tilimizning hayotbaxsh qudratiga tayanamiz” - Sh.Mirziyoyev. Keyingi yillarda o‘zbek tilshunosligining turli tarmoqlarini to‘liq yoritishga bag‘ishlangan qator izlanishlar olib borilmoqda. Zamonaviy axborot texnologiyalari tilning funksional imkoniyatlaridan foydalanish borasida benihoya keng qulayliklar eshigini ochdi. Kompyuter tarjimasi, tahriri, tahlili, elektron lug‘atlar va tezaurus(til xazinasi)lar fikrimiz tasdig‘idir. Ayniqsa, zamonaviy elektron lug‘atlar tuzish va ulardan foydalanish madaniyatini shakllantirish til imkoniyatini kengaytirishda muhim ahamiyatga ega. Bu borada til korpusini yaratish hamda korpus lingvistikasini rivojlantirish tilshunoslik, til o‘qitish metodikasi sohalaridagi dolzarb masalalardan biri hisoblanadi. O‘zbek tili milliy korpusini yaratish jarayonida xalqaro miqyosda korpus lingvistikasi bo‘yicha amalga oshirilgan ishlarni o‘rganish va ularning tajribasini o‘zbek tilining milliy korpusini yaratishga joriy qilish dolzarb vazifalardan hisoblanadi. Bir tilli korpusda til varianti va shevalar bir-biriga qarama-qarshi qo‘yilsa, ikki va ko‘p tilli korpus bir mavzu doirasida turli tilda yozilgan matnlar majmuidan iborat bo‘ladi. Masalan, ma`lum ilmiy muammo borasida turli davlatda turli tilda o‘tkazilgan konferensiya materiallarini qamrab olishi mumkin. Ko‘p tilli korpuslar, odatda, tarjimonlar tomonidan foydalaniladi. Ko‘p tilli korpusning yana bir ko‘rinishi original matn va tarjima matndan iborat bo‘ladi. Korpusning ushbu turi qiyosiy chog‘ishtirma tadqiqot olib borishda, tarjima nazariyasi hamda kompyuter tarjimasini o‘rganishda juda muhim manba bo‘lib xizmat qiladi.
Bugungi kunga kelib faoliyat yuritayotgan va kundan kunga hajmi kengayayotgan O‘zbek tili korpusi loyihasi 2018-2021 yillar oralig‘idagi ERASMUS granti tufayli yaratilgan va bu loyiha asoschisi filologiya fanlari doktori(DSc) Abduraxmonova Nilufar bo‘lib, korpus hajmi 50 mlndan ortiq so‘z. Korpus ishga tushirilganda so‘zlar izlashda qaysi soha bo‘yicha izlashni tanlash va bundan tashqari uslub, davr tanlanadi:

Yuqorida foydalanuvchi tomonidan lemma bo‘yicha “ona” so‘z izlanib, badiiy uslub va sovet davri tanlanmgan. Natijada esa 28 ta hujjatda 137 ta so‘z uchragan. Bu korpusda morfoanalizator bo‘yicha ham izlash mavjud. Bunda har bir so‘z morfologik tahlil qilinib, qaysi turkumga kirishi va asos-qo‘shimchalarga ajratilishi ko‘rsatiladi. “Kitobxon” so‘zi izlash uchun kiritilganda:
kitob: Root word (noun)
kitobxon: belongs to Noun
xon: The ending that forms the noun (personality, character)
ko‘rinishida tahlil qilindi. Sanab o‘tilganlardan tashqari korpus ichida subkorpuslar ham ishlab chiqilmoqda: parallel, mualliflik, lingvistik, ta’limiy korpus va boshqalar. Lingvistik resurslar qismida esa etimologik lug‘at, sinonim lug‘at, inglizcha-o‘zbekcha fe’lli frazemalar, terminlogik lug’atlar mavjud.
N.Abdurahmonovaning “O‘zbekcha matnlarni ovozlashtirish dasturining lingvistik ta’minotini ishlab chiqishda ayrim masalalar tadqiqi” nomli maqolasida so‘z turkumlari, tinish belgilari, arab va rim raqamlarini yozish va o‘qishda uchrovchi bir qator kamchiliklar sifatida keltiriladi. Bunda bazaga ma’lumot kiritishda matnning qaysi bandida chiziqcha, qaysi birida tire ekanligi va -inchi qo‘shimchalariga ham e’tiborli bo‘lish kerak. Yaratiladigan dastur esa buni tushunib olishi lozim. Tinish belgilari yozilgan paytda qo‘yiladigan belgilar ovozli matnda o‘qilmaydi. O‘zbekcha matnlarni ovozlashtirish dasturining har qanday o‘zbek tilidagi matnlarni hech qiyinchiliksiz o‘qib berishda uning lingvistik ta’minotining qay darajada muakammal ishlab chiqilgani katta ahamiyatga egadir. Shuningdek, o‘zbek tiliga boshqa tillardan, asosan, rus tili va u orqali boshqa tillardan o‘zlashgan ruscha internatsional so‘zlarni tadqiq etish va bunday so‘zlarni dastur lingvistik ta’minotiga kiritish masalalarini o‘rganish vazifasi ham oldimizda ko‘ndalang turibdi. O‘zlashma so‘zlarning talaffuzi o‘zbek tili so‘zlari talaffuzidan farq qilgani bois ham ularning audio formatdagi va yozma shaklini lingvistik ta’minotga kiritish dasturning bunday so‘zlarni xatosiz o‘qishiga imkon yaratadi8.
Bundan tashqari o‘zbek tilida unli harflarning qisqa cho‘ziqligi ham og‘zaki nutqda ta’sir etmay qolmaydi: ilm [il:m]bilim [bılım] o‘lka [olka]  o‘lka [ölka] kabilar.
Iste’moldan chiqish xavfi ostiga kelib qolgan tillar uchun ularning elektron bazasi va korpusini yaratish, shu tilga taalluqli bo‘lgan ilmiy va badiiy adabiyotlar yillar davomida asrashga, ular ustida bir qancha ilmiy ishlar qilishga imkon beradi.
Umuman olganda, audio korpuslar ta’limga ayniqsa, maktab yoshidagi bolalar nutqini kuzatib borishda yuqori samaradorlikka erishishga yordam beradi. Sababi til ijtimoiy hodisa sifatida doimiy ravishda o‘zgarib turadi, qaysidir so‘zlar neologizm sifatida kirib kelsa, ba’zilari esa tarixiy so‘zlarga aylanadi. Bu jarayonni esa multimediali korpus orqali bevosita kuzatib borish mumkin. Ko‘rinib turibdiki, korpus nafaqat soha kishilarning, balki tilni rivojlantirishda umummilliy masala hisoblanadi.
Yuqoridagi korpuslar yaratishda kattagina ma’lumotlar bazasi, izchillik, xronologik ketma-ketlik juda zarur. Qolaversa, so‘nggi yillar mobaynida qog‘oz materiallar kamayib ketayotganligi tufayli raqamli texnologiyalar asosida elektron korpus yaratish bu mas’uliyatli ish. Istalgan soha xodimi bunday korpuslardan foydalana olishi va ish jarayonida uni qo‘llay olishiga erishilsa, samaradorlik kuchayadi. Iste’moldan chiqish xavfi ostiga kelib qolgan tillar uchun ularning elektron bazasi va korpusini yaratish, shu tilga taalluqli bo‘lgan ilmiy va badiiy adabiyotlarni yillar davomida asrashga, ular ustida bir qancha ilmiy ishlar qilishga imkon beradi. Qolaversa, “asosiy ish quroli so‘z bo‘lgan” barchaga elektron korpuslar juda katta manba vazifasini bajaradi.


Download 0,58 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish