5-ma’ruza: Tabiiy tilda kompyuterlar bilan muloqot qilish. Nutq aloqa tizimlari
1950-yillardan beri AI tadqiqotining mashhur mavzularidan biri hisoblash tilshunosligi, xususan, mashina tarjimasi bo'ldi. Xomskiyning [5.1], Vudsning [5.2], Vinogradning [5.3], Shenkning [5.4] chet eldagi fundamental asarlari va mamlakatimizda Popov [5.5], Malkovskiy [5.6], Kuzin [5.7] asarlari paydo boʻladi. Ushbu tadqiqotlar shuni ko'rsatdiki, hisoblash tilshunosligi muammolari unchalik oddiy emas va yanada chuqur o'rganish va rivojlantirishni talab qiladi.
Tabiiy tilni tushunish muammolari
Tabiiy tilni, u matn yoki nutqni tushunish muammolari ko'p jihatdan mavzuni bilishga bog'liq. Tilni tushunish uchun so‘zlovchining maqsadi va kontekstini bilish talab etiladi. Bundan tashqari, innuendo yoki allegoriyani hisobga olish kerak. Masalan, "Vanya Masha bilan gulli o'tloqda uchrashdi" degan oddiy jumlada ham biz gullar bilan kim bo'lganini tushunmayapmiz: Vanya, Masha yoki o'tloqmi? Yana bir misol “Doktor ingliz tilida bemalol gapirardi”.
Ushbu jumlani tahlil qilib, tahlil natijasida shifokor ayol ekanligini qayd etish kerak. Mashhur rus tilshunosi, akademik L.V.Shcherbaning "Glokaya kuzdra shteko yonboshi va jingalak bokrenka burmalab oldi" degan jozibali iborasi bunday "tushunib bo'lmaydigan" ibora rus tilining barcha qoidalariga muvofiq tuzilganligi, bu bilan hech qanday muammo tug'dirmasligini aytadi. bunday jumlaning grammatik tahlili, lekin u tushunish muammolarini keltirib chiqaradi. Keling, tabiiy tilni tushunishning ba'zi muammolarini shakllantirishga harakat qilaylik.
1. SENSE-TEXT muammosi. Biz hozirgina bu haqda gapirdik va bu muammoga yana bir misol keltiramiz. Jumlada "Qaysi zavod Belgiyadagi konvertor sexiga asbob-uskunalar buyurtma qilgan?" ma'nosi noaniq: buyurtma Belgiyada qilinganmi yoki ustaxona Belgiyada joylashganmi.
2. Rejalashtirish muammosi, masalan, "Qaerga uchishni xohlaysiz?" mavzusida dialog o'tkazish zarur bo'lganda paydo bo'ladi. Bunday holda, siz mavzu bo'yicha chuqur bilimga ega bo'lishingiz kerak (parvoz raqamlari, kelish va jo'nash vaqtlari, narxlar va boshqalar).
3. Ekvivalentlik muammosi. “Uyning yonida fil turibdi” va “Uyning yonida tanasi va tishlari bor jonzot turadi” degan ikki jumla bo‘ladimi? Bir qarashda, bu takliflarning tengligiga shubha yo'q. Va agar bilimlar bazasida tanasi va tishlari bo'lgan jonzot ikki ma'noda aniqlansa: fil va mamont, unda bunday shubhalar paydo bo'lishi mumkin.
4. Muloqot ishtirokchilari modellari muammolari. Muloqot ishtirokchilari bilimlarni ifodalashning taqqoslanadigan modellariga, zarur tushunish chuqurligiga, mantiqiy xulosa chiqarish imkoniyatiga, harakat qilish qobiliyatiga ega bo'lishi kerak.
5. Elliptik tuzilmalar muammosi, ya'ni dialogning tushib qolgan elementlari. Masalan, “Kiyimingni asra, yoshlikdan izzat” maqolida gapning ikkinchi qismi sintaktik ellips bo‘ladi (fe’l tushirilgan).
6. Vaqtinchalik qarama-qarshiliklar muammosi. Masalan, “Men ertaga kinoga borishni xohlardim” jumlasida o‘tgan shakldagi “istayotgan” fe’li “ertaga” kelasi zamonning vaziyati bilan birikkan, bu umumiy qabul qilingan mantiqqa ziddir.
Keling, muammolar ro'yxati bilan yakunlaymiz va asosiy tushunchalar haqida gapiramiz. Dastur bilan aloqa qilish uchun tillar quyidagilar bo'lishi mumkin: menyu tili, buyurtma tili, anketa tili. Bu tartibga solinadigan tillar, soddalashtirilgan tahlil qilish sxemalari ularda, masalan, kalit so'zlar bo'yicha ishlashi mumkin va biz bu tillarni hisobga olmaymiz. Tabiiy til (NL) sifatida biz Cheklangan tabiiy tilning (LNL) kichik to'plamini ko'rib chiqamiz - bu oxirgi foydalanuvchi NLning professional yo'naltirilgan kichik to'plamidir. OEEni tahlil qilish uchun Lingvistik Translators (LT) deb nomlangan dasturiy paketlardan foydalaniladi. LT ning mumkin bo'lgan blok diagrammasi 5.1.rasmda ko'rsatilgan.
Расм. 5.1. LT blok diagrammasi
Keling, asosiy tushunchalarni aniqlaymiz yoki eslaylik. So'z tilning asosiy birliklaridan biri bo'lib, ob'ektlar, shaxslar, jarayonlar, xususiyatlar va boshqalarni nomlash uchun xizmat qiladi. Taklif - bu biror narsa haqida xabar bo'lgan har qanday bayonot. So‘z birikmasi ikki yoki undan ortiq so‘zning tobe bog‘lanishi (kelishuv, nazorat, qo‘shilish) asosida hosil bo‘lgan eng sodda nutq birligidir. Jumladan farqli o'laroq, ibora, qoida tariqasida, xabar emas. Diskurs izchil matndir. Leksema - leksik ma'nolarining butun majmuasidagi so'z.
Morfema - so'zning minimal tugallangan qismi. Affiks - so'zning o'zagiga biriktirilgan qismi (prefiks, qo'shimcha, infiksga bo'linadi). Omonimlar - ma'no jihatdan har xil, lekin so'zlar, morfemalar va boshqa til birliklarining yozilishida bir xil ("silovas" - yuguruvchi, "silovsin" - hayvon). Sinonimlar - imlosi har xil, lekin ma'nosi bir xil ("qichqiriq", "baqir" yoki "yo'l", "yo'l") so'zlar. Ellipsis - jumlada tushib qolgan so'zlar ("Men minaman, sizmi?"). Anafora - bu taklif ob'ektlarining takrorlanishi ("Shahar ajoyib, shahar kambag'al" - A.S. Pushkin).
Do'stlaringiz bilan baham: |