Alisher Navoiy nomidagi Toshkent
davlat o‘zbek tili va adabiyoti
universiteti
“O‘ZBEK MILLIY VA TA’LIMIY
KORPUSLARINI YARATISHNING NAZARIY
HAMDA AMALIY MASALALARI”
Xalqaro ilmiy-amaliy konferensiya
Vol. 1
№. 01 (2021)
327
Amerika, Rossiya, Turkiya va boshqa ko’plab rivojlangan davlatlar matnlarni hissiy jihatdan uch
turga bo’lib o’rganadilar. Bunda fikrlar ijobiy, salbiy yoki betaraf (neytral) deb baholanadi. Masalan:
Salbiy baho: “Shirin-shakar“ firmasi chiqargan mahsulotlar bolalarda kassalliklar rivojlanishiga sabab
bo'lmoqda. Ijobiy baho:
Hozircha mahsulot bo’yicha o‘tkazayotgan tajribam juda yaxshi natijalarni
ko’rsatmoqda. Betaraf baho: Menda mahsulot bilan bogliq birorta yomon voqea roy bermadi
Ba’zi yomon narsalar yuz berdi, xafa bo‘ldim, ammo bugun o‘zimni yaxshi his qilyapman –
gapini tahlil qilsak, yomon, xafa, va yaxshi so’zlari qo’llanilgan bo‘lib, salbiy ma’no ifodalovchi ikkita va
ijobiy ma’no ifodalovchi bitta so‘z bor.Birinchi qismida salbiy, ikkinchi qismida ijobiy ma’no
ifodalangan. Tarkibida
ammo
,
lekin
,
biroq
kabi bog‘lovchilar qatnashgan gaplarda ushbu
bog‘lovchilardan oldin kelgan qism tahlilda tashlab ketiladi. Demak bu gap ijobiy ma’noda deb qabul
qilinadi.
Ishsizlik, yomon, urush, xavf, muammo
(salbiy ma'no) yoki
inson huquqlari, noyob, o’sish
,
yordam
(ijobiy ma'no) kabi ob'ektiv so'zlar to'g'ridan-to'g'ri hissiyotlarni ifoda etmaydi, balki matnda
berilgan munosabatlarga hamroh bo'lishi yoki qarama-qarshi ma’no ifodalayotgan bo'lishi mumkin: U
yomon odam (salbiy ma’noda) – Qo‘pol so’zlarni aytish yomon (ijobiy ma’noda).
Fasebook, Instagram, Twitter kabi ijtimoiy tarmoqlarda sharhlarni tahlil qilishda yana bir jihat
borki, bu emojilarning ko’p qollanilishi. Fikrini tezda va oson ifodalashning bir ko‘rinishi bo‘lgan
emojilar har bir foydaluvchi kayfiyatiga mos bo‘lgan ko‘rinishlarni taqdim etadi: mamnun bo‘lish,
xafagarchilik, norozilik kabi.
Fikr bildirishning eng ixcham shakli ham bo‘lib, bu yulduzchalardir. Ijtimoiy tarmoqlarda ko‘p
uchratadiganimiz bu yulduzchalar mahsulot yoki xizmatlarni baholashning tez va oson turi. Masalan:
aloqa sifatini baholang deb bechta yulduzcha shakli ko‘rsatiladi. Ikkigacha yulduzcha salbiy baho, to‘rt
yoki beshta yulduzcha ijobiy baho, uchta yulduzcha esa betaraf yoki o‘rtacha baho berilganligini
ifodalaydi.
Matn tahlilidagi asosiy qiyinchilik inson tillarining noaniqligidadir. O‘zbek tilidagi matnlar uchun
sentiment tahlili dasturini ishlab chiqishda mazkur tilning xususiyati hisobga olinishi zarur. O‘zbek tili
O‘zbekistonda rasmiy til hisoblanadi. O‘zbek tili turkiy tillar oilasining Oltoy guruhiga mansub bolib,
viloyatdan- viloyatga o‘zgaruvchi sheva va dialektlardan iborat ko‘p tilli hissiy so‘zlar to‘plamini o‘z
ichiga oladi. Turkiy oilaga kiruvchi boshqa tillar, jumladan, turk va qozoq tillari bu sohada ancha ilgarilab
ketishdi. Hissiy jihatdan qutblanish manbalari yaratilmagan tillar uchun eng oddiy yechim ingliz tilidagi
manbalarni tarjima qilish bo‘lishi mumkin [3]. Ammo agglyutinativ (so‘z o‘zak yoki asosini
o‘zgartirmasdan qo’shimcha qo‘shish orqali so’z yasaladi) harakterga ega bo’lgan o‘zbek tili uchun bu
to‘g‘ri yechim emas. O‘zbek tilida ibora, kinoya piching va kesatiqlardan keng foydalaniladi. Bu esa
mashinaga tahlil qilish jarayonida qiyinchilik tug’diradi.Masalan: Qirq marta o‘lchab, bir marta kesadi –
ehtiyotkor ma’nosida qo‘llaniluvchi ushbu iborani kompyuter alohida-alohida so‘zlar sifatida qabul
qiladi. Kinoyaviy qollanilgan soz og’zaki nutqda oziga xos, farqli intonatsiya bilan aytilsa, yozuvda
kopincha qoshtirnoq bilan ijratiladi: Bugun jug’rofiya oqituvchisi darsga kelmadi. So’ridan yiqilib,
oyog’ini sindiribdi. Bu “xushxabar”dan keyin butun sinf boshadi-qoldi. “Shumxabar” tarzidagi bu
kinoyani mashina tushunadigan dastur ishlab chiqishni talab qiladi.
Tasniflashdagi yana bir jihat so‘zlarning mintaqalar va madaniyatlardagi farqlanishi ya’ni so‘z
ma’lum hududda ijobiy, boshqa hududda esa betaraf baholanishi mumkin: Ilonni yog’ini yalagan – bizda
salbiy ma’noda tushunilsa, Koreys xalqida ayollarni ilon kabi deb ta’riflash ijobiy ma’noda qabul
qilinadi.
O’zbek tilidagi sentiment tahlili ilk marotaba O‘zbekiston Milliy universitetida Sanatbek
Matlatipovning magistrlik dissertatsiya ishida Google Play Store ilovalarining 100 ta sharhlaridan birinchi
kutblilik tasnifi amalga oshirildi. Ushbu ishda hissiyotlar salbiy va ijobiy jihatdan tasnif qilinadi, betaraf
sinf ko‘rib chiqilmagan [4]. Samarqand Davlat Universitetida Ilyos Rabbimov boshchiligidagi bir guruh
izlanuvchilar o’zbek filmlariga qoldirilgan sharhlar emojilar asosida o’rganildi [5].
Mavjud adabiyotlarda fikrlarni avtomatik tasniflashning tabiiy tilni qayta ishlash (NLP), mashina
o’rganish algoritmlariga asoslangan klassifikasiya (ML), logistik regressiya (LG), qo’llab-quvvatlash
vektor mashinalari (SVM), Bayes klassifikasiyasi, neyron tarmoqlari kabi ko’plab metodikalari tavsiya
etiladi.
O‘zbek tilida berilgan matnli ma’lumotlardan inson fikrini ifodalashni avtomatik keltirib
chiqarishni shakllantiradigan modellar qurish asosiy vazifa bo‘lib turibdi. Buning uchun ingliz tilida
Do'stlaringiz bilan baham: |