Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
62
O.V.Kukushkina, А.А.Polikarpov, Ye.V.Surovsevalar tomonidan amalga oshirilgan [O.V.Kukushkina,
А.А.Polikarpov, Ye.V.Surovseva, 2011].
Milliy til korpusi mavjud bo‘lgan tillarda mualliflik korpusi ham yaratilgan. Bugun internet
tarmog‘ida bir necha ochiq manbali mualliflik korpuslari mavjud. Gutenberg loyihasidan olingan 250
million so‘z bilan ingliz tilidagi taxminan 3000 ta badiiy matnlar korpusi tasvirlangan, ular 130 dan ortiq
mualliflar (masalan, Darvin, Dikkens, Shekspir) tomonidan yozilgan badiiy va badiiy bo‘lmagan
janrlarni qamrab olgan [https://www.gutenberg.org/]. Shekspir asarlari korpusi 2001-yilda Erik
M.Jonson tomonidan o‘ylab topilgan bo‘lib, 1864-yilgi Globe nashri asosida Shekspirning to'liq asarlari
jamlangan [https://www.Opensourceshakespeare.org/]. Tatar badiiy matnlar korpusida tatar
mualliflarining nasriy va she'riy asarlari, ayrim folklor janrlarining matnlari, shuningdek, boshqa tillardan
tatar tiliga tarjima qilingan asarlar kiritilgan. “Korpus” ga joylashtirilgan har bir asar metatekst
markirovkasiga ega bo'lib, unda muallif, asar nomi, janri va yaratilish vaqti haqida ma’lumotlar mavjud
[http://litcorpus.antat.ru/index.html].
Boshqird she’riyat korpusi 1,8 milliondan ortiq so‘zni tashkil etadi,
taxminan 450 ming satr she’riy asar, 101 shoirning 17 mingdan ortiq she’ridan iborat. Bu dunyodagi
ikkinchi rus she’riy korpusi hisoblanadi. Uning o‘ziga xosligi shundaki, matn to‘plami XX asr va XXI asr
boshlarida boshqird shoirlarining she’riy asarlaridan iborat.
Tojik tili milliy korpusi tarkibiga alohida
mualliflar korpusi birlashtirilgan [http://www.termcom.tj]. Mualliflik korpusi tarkibidan mumtoz
adabiyot namoyondalari Rudakiy, Firdavsiy, Sa’diy Sheroziy, Mavlono Rumiy, Hofiz Sheroziy va
zamonaviy adabiyot namoyondalaridan Loyiqali Sherali, Mo‘min Qanoat, Habibullo Fayzullolar
mualliflik korpusi joy olgan. Turk tili va adabiyoti korpusi mundarijasida xalq dostonlari, she’rlar,
hikoyalar, kitoblarning elektron shakli, maqolalar, dramalar, komediyalar, maktublar, reportajlar va
qardosh xalqlar, jumladan, qozoq, qirg‘iz, o‘zbek, tatar adabiyoti ham o‘rin olganini ko‘ramiz
[https://edeb.net].
O‘zbek korpus tilshunosligida mualliflik korpusi bo‘yicha tilshunos olima Sh.Xamrayeva ilmiy
tadqiqot olib borgan, endi uni amaliy jihatdan qo‘llash vaqti keldi [Hamroyeva Sh.M, 2018]. O‘zbekiston
milliy universiteti Jurnalistika fakulteti O‘zbek tilshunosligi kafedrasi Kompyuter lingvistikasi
mutaxassisligi professor-o‘qituvchilari hamda magistrantlari tomonidan mualliflik korpusi tuzish
tamoyillari o‘rganib chiqilmoqda hamda o‘zbek milliy adabiyoti korpusini yaratish loyihalashtirilmoqda.
Ushbu loyihalashtirilayotgan korpus o‘zbek milliy adabiyotiga oid matnlarni elektron holda bir joyga
to‘plash, lug‘atlar tuzish, leksikografik manba sifatida foydalanishni ko‘zda tutadi.
Korpus mundarijasida bolalar adabiyoti, xalq dostonlari, o‘zbek folklori, mumtoz adabiyot
bo‘stoni, jadid adabiyoti, XX asr adabiyoti, mustaqillik davri adabiyoti kabi bo‘limlarni o‘z ichiga oladi.
Har bir ijodkor korpusida “Tarjimayi holi”, “She’rlari”, “Nasriy asarlari”, “To‘plamlari”, “Tarjima
asarlari”, “Adabiy maqolalari”, “Suratlari”, “Video lavhalari”, “Audio fayllari”, “Shoir ijodi bo‘yicha
qilingan tadqiqotlar”, “Konkordans”, “Parallel konkordans” kabi qidiruv oynalari mavjud bo‘lishi ko‘zda
tutilgan, ijodkor asarlarini HTML, PDF shaklda (formatda) har qanday kompyuterda o‘qish va yuklab
olish imkoni bo‘ladi. “Konkordans” oynasida ijodkorning chastotali lug‘ati alifbo tartibida beriladi.
Bunda muallifning so‘z qo‘llash bilan bog‘liq mahorati, muallif nutqida tillarning grammatik
Do'stlaringiz bilan baham: |