XORAZM MA
’
MUN AKADEMIYASI AXBOROTNOM
А
SI
–
9/2020
268
ТЕХНИКА ФАНЛАРИ
UO
’
K 519.765
KOMPYUTER LINGVISTIKASIDA MATNNI AVTOMATIK QAYTA ISHLASH
MODELLARINI YARATISH
M.K. Djurayev,
katta o’qituvchi, Termiz davla
t universiteti, Termiz
Annotatsiya.
Maqolada
kompyuter lingvistikasining asosiy vazifalari, matnni avtomatik qayta
ishlash modellarini yaratish, algoritmlar, dasturlar tarkibini
shakllantirish masalalari o’rganilgan.
Kalit so’zlar
:
kompyuter lingvistikasi, matnni avtomatik qayta ishlash, modellarni qurish,
algoritmlar va dasturlar sifatini shakllantirish, nutqni bilish, sintez qilish, tahlil qilish, matnlarni
yaratish.
Аннотация.
В статье исследуются основные задачи компьютерной лингвистики,
создание моделей автоматической обработки текстов, формирование алгоритмов,
структура программ.
Ключевые слова:
компьютерная лингвистика, автоматическая обработка текста,
построение моделей, формирование качества алгоритмов и программ, знание речи,
синтезирование, анализ, создание текстов
Abstract.
The article examines the main tasks of computer linguistics, the creation of models
of automatic word processing, the formation of algorithms, the structure of programs.
Keywords:
computer linguistics, automatic text processing, building models, shaping the
quality of algorithms and programs, knowing speech, synthesizing, analyzing, creating texts
Matnli ma'lumotlarni avtomatik qayta is
hlash uchun ko’plab kompyuter texnologiyalaridan
foydalanishga to’g’ri kelgan, xususan biri
nchi kompy
uterlar paydo bo’lgandan so’
ng darhol bu
ishlar boshlab yuborilgan. Bugungi kunga kelib, matnni qayta ishlash uchun axborot
texnologiyalarini qo’llashning bir qator istiqbolli yo’nalishlari ishlab chiqilgan
- klassik matn
muharrirlaridan tortib to mashinasozlik tizimlarigacha.
Matematik, mashina yoki kompyuter lingvistikasi deb ham ataladigan kompyuter lingvistikasi
nisbatan yangi takomillashgan dastur hisoblanadi. Tabiiy tillar bilan ishlash uchun mashinalardan
foydalanish, keyinchalik sun’iy int
ellektdan foydalanish tizimlari shakllantirildi. Bu dastur
informatika, matematika, sun
’iy intelekt va tilshunoslik fanlari asosida paydo bo’ldi. Xususan,
ushbu yo
’
nalishni rivojlantirish umumiy tilshunoslikka asoslanadi [2].
Tabiiy tilni qayta ishlashning
an’anaviy
usullarini kompyuter lingvistikasidan farqi shundaki,
birinchisi tilshu
noslik o’rganadigan barcha jarayonlarni modellash
tirishga, ikkinchisi tabiiy tillarni
tavsiflay oladigan matematik modellarni yaratishga qaratilgan [3]. Kompyuter lingvistikasining
asosiy vazifasi matnni avtomatik qayta ishlash uchun tizim modellari va ularga tegishli algoritmlar
va dasturlar sifatida shakllantirishni amalga oshirishdan iborat.
Masalan, tilshunoslikda kompyuterlardan foydalanishning eng aniq usuli bu bizning
davrimizda
har kuni ko’plab odamlar tomon
idan ishlatiladigan mashina tarjimasidir.
Kompyuter tarjimasi badiiy matnlar uchun mos emas, chunki badiiy nutq uslubining
xususiyatlari turli xil tillar orasida juda katta farq qilishi mumkin.
Shuningdek, avtomatlashtirilgan tarjima ham mavjud, u kompyuterning tarjimasidan farq
qiladi, chunki u
ning o’zi tarjima qiladi, dastur esa unga yordam beradi, tarjimaga sarf qilinadigan
vaqtni qisqartiradi va tarjima qilingan matnning sifatini yaxshilaydi.
Masalan, statistik mashina tarjimasi dasturi ikki xil t
ilda yozilgan bo’ladi, ammo
bir xil
ma’noni anglatadigan juda ko’p juft jumlalarni taqqoslaydi. Bunday dasturlar o’rganish qobiliy
atiga
ega. Masalan, Google tomonidan yaratilgan tarjimon dastur.
Ammo kompyuterlardan nafaqat matnni tarjima qilish, balki uni qayta ishlash uchun ham
foydalanish mumkin. Nutqni bilish va sintez qilish, tahlil qilish va matnlarni yaratish - bu
yo’nalishning asosiy vazifalaridir. "Tushunish" so’zining juda aniq tushunchasi sun’iy
intelektning
asosiy vazifalaridan biridir. Lingvistik noaniqlik - bu tabiiy tillarni qayta ishlashning asosiy
muammosi va ularning yechimi tarjima orqali ichki tuzilishiga tabiiy tillarning tashqi vakili sifatida
faoliyat ko’rsa
tishiga olib keladi.
Shu yerda bir narsaga e
’tibor qaratish lozim bo’ladi, ya’ni matn avlodini esga olishi
mizga
to’g’r
i keladi.
Matn yaratuvchilarining o’zlariga e’tibor qaratish kerak, matnni yaratish (yarati
shi)
mumkin bo’lgan dasturlar, odatda til normalarini qo’llash nuqtai nazaridan to’g’ri, am
mo umumiy
Do'stlaringiz bilan baham: |