GAP QO'ShIMChA QISM
Matndan nutqqa o'tish tizimlari tomonidan ishlatiladigan lingvistik tahlilning ko'p qismi, yuqorida aytib o'tilganidek, so'zlar darajasida amalga oshiriladi. Ammo bir nechta so'z birikmalari va jumlalarni, hatto paragraf darajasi yoki diskurs sohalarini qamrab oladigan juda muhim fonologik jarayonlar mavjud. Ushbu cheklashlarning eng sodda qismi nutqning sintaktik qismiga bog'liq. Ko'p so'zlar "shamol, o'qish, ishlatish, bekor qilish va so'rov o'tkazish" kabi nutqning ishlash qismiga qarab farqlanadi. Shunday qilib, bular orasida "ishlatish" so'z yoki fe'l bo'lishi mumkin va shunga ko'ra uning talaffuzini o'zgartiradi, "bekor" esa ot yoki sifat bo'lishi mumkin, bu erda asosiy stressning joylashuvi nutq qismini ko'rsatadi. Bir so'zli darajadagi qo'shimchalar nutqning bir qismini bashorat qilishda etarlicha cheklov kuchiga ega, shuning uchun "dom" "qirollik" va "ness" singari ismlarni ishlab chiqaradi. "mehribonlik" singari ismlarni ishlab chiqaradi. Ammo ingliz tilida affiks sifatida ishlaydigan yakuniy "lar" ko'plik yoki uchinchi shaxsning hozirgi zamon birlik fe'lini hosil qilishi mumkin va har bir umumiy ism fe'l sifatida ishlatilishi mumkin. Ushbu vaziyatlarni ajratish va nutqning ishlaydigan qismini ishonchli hisoblash uchun dinamik dasturlash algoritmi ishlab chiqilgan (Cherch, 1988; DeRose, 1988; Jelinek, 1990; Kupiec, 1992), bu nutq qismlarini juda yuqori aniqlikda belgilaydi. Ushbu algoritm yana bir bor etiketli (nutqning bir qismi uchun belgilangan) korpusni statistik o'rganishga tayanadi va zamonaviy statistik metodlarning ajoyib imkoniyatlarini namoyish etadi. va har bir umumiy ism fe'l sifatida ishlatilishi mumkin. Ushbu vaziyatlarni ajratish va nutqning ishlaydigan qismini ishonchli hisoblash uchun dinamik dasturlash algoritmi ishlab chiqilgan (Cherch, 1988; DeRose, 1988; Jelinek, 1990; Kupiec, 1992), bu nutq qismlarini juda yuqori aniqlikda belgilaydi. Ushbu algoritm yana bir bor etiketli (nutqning bir qismi uchun belgilangan) korpusni statistik o'rganishga tayanadi va zamonaviy statistik metodlarning ajoyib imkoniyatlarini namoyish etadi. va har bir umumiy ism fe'l sifatida ishlatilishi mumkin. Ushbu vaziyatlarni ajratish va nutqning ishlaydigan qismini ishonchli hisoblash uchun dinamik qismli dasturlash algoritmi ishlab chiqilgan (Cherch, 1988; DeRose, 1988; Jelinek, 1990; Kupiec, 1992), bu nutq qismlarini juda yuqori aniqlikda belgilaydi. Ushbu algoritm yana bir bor etiketli (nutqning bir qismi uchun belgilangan) korpusni statistik o'rganishga tayanadi va zamonaviy statistik metodlarning ajoyib imkoniyatlarini namoyish etadi.
PARSING
Ayrim so'zlar uchun nutqning ishlash qismini aniqlashdan tashqari, zamonaviy matndan nutq tizimlari ham cheklangan sintaktik tahlil yoki tahlilning ba'zi bir shakllarini amalga oshiradilar. Ushbu tahlillardan ko'p jihatdan foydalanish mumkin. Yuqorida aytib o'tilganidek, so'zning alohida talaffuzi nutqning bir qismiga qarab farq qilishi mumkin. Bunga qo'shimcha ravishda, tahlil qilish tahlili prosodik (yoki suprasegmental) xususiyatlarni, masalan, mashhurlik, kesma va jumla turi (deklarativ, savol yoki buyruq) kabi belgilar uchun tarkibiy asos yaratishi mumkin. Segment davomiyligini va balandlik konturlarini aniq hisoblash uchun hech bo'lmaganda minimal sintaktik ma'lumotlarga asoslanib bunday prosodik belgilar belgilanishi kerak, aks holda natijada nutq tekis, tinglash qiyin va hatto tushunarsiz bo'ladi.
Sintetik nutqning tarkibiy asoslarini ta'minlashga yordam berish uchun ajralishni asoslash kerakligi sababli, sintaktik tuzilish va prosodik tuzilish (ma'ruzachilarning so'zlarni tabiiy ravishda guruhlash usuli) o'rtasida bevosita bog'liqlik borligi uzoq vaqtdan beri taxmin qilinmoqda. So'nggi o'n yil ichida bu nuqtai nazar tobora ko'proq e'tirozga uchradi va hozirgi kunda ko'plab fonologlar ushbu tuzilmalar o'rtasida sezilarli farqlar mavjud deb hisoblaydilar (Selkirk, 1984). Shunga qaramay, zamonaviy tizimlar tomonidan ishlatiladigan mahalliy ibora darajasidagi tahlil dastlabki bosqichda juda foydali bo'lgan tuzilmani taqdim etadi, garchi keyinchalik o'zgartirilishi mumkin bo'lsa-da, u prozodik belgilar uchun substrat bilan ta'minlanishi mumkin (keyingi qism). Bundan ham kuchliroq nuqtai nazar, istalgan narsa pragmatik va semantik tuzilish bilan tovush o'rtasidagi bog'liqlik va sintaksis va intonatsiya o'rtasidagi har qanday yozishmalar, asosan, sintaksis va intonatsiya o'rtasidagi munosabatlarning yon mahsuli, deb da'vo qilar edi. -semika va pragmatikaning darajadagi cheklovlari, boshqa tomondan (Monaghan, 1989). Shunga qaramay, ushbu imkoniyatga qaramay, tizimning kiritilishi faqat matndan iborat bo'lganida, bunday yuqori darajadagi cheklovlar mavjud emasligini hisobga olib, hozirgi zamon uchun iboralar darajasida tahlil zarur strukturaviy asosni ta'minlashi kerak. Ma'lumotlarni ishlab chiqaruvchi tizimdan ma'lumot olinadigan bo'lsa, unda semantik va pragmatik mulohazalar xabarni tuzish jarayonini boshqaradi, prosodik korrelyatlarni aniqlash uchun muqobil prosodik tuzilmalar mavjud bo'lishi mumkin (Young and Fallside, 1979).
Afsuski, cheklanmagan matnni to'liq darajadagi tahlil qilish hal qilinmagan muammodir. Shunga qaramay, ibora darajasida tahlil tez va ishonchli bo'lib, modda-darajadagi tahlilning muhim murakkabliklaridan qochadi. Fraza darajasidagi tahlilning muvaffaqiyatining asosiy sababi ot iboralaridagi aniqlovchi ketma-ketliklarning va fe'l iboralaridagi yordamchi ketma-ketliklarning yuqori sintaktik cheklov qobiliyatidir. Matndan nutqqa ko'plab tizimlar
tems tez va aniq ibora darajasida tahlil qilishni ta'minlaydi (Allen va boshq., 1987; Cherkov, 1988), bu prosodik belgilarni o'rnatish uchun etarli asos yaratadi. Shunday qilib, "U parkdagi odamni teleskop bilan ko'rdi" degan klassik jumlaga, bu erda prepozitsiya tarkibidagi so'z birikmalarining biriktirilishi bir necha tomonlama noaniq bo'lib, talaffuz (shu jumladan, prozodikalar) aniq frazemali tahlildan kelib chiqishi mumkin. band darajasidagi noaniqlikni hal qilish zarurati. Albatta, mavjud bo'lganda, klause darajasida tahlil qilish ko'pincha ishlatilishi mumkin, shuning uchun bunday tuzilmalar uchun tahlilchi foydali bo'lishi mumkin, chunki bu so'zsiz darajadagi tahlilni ololmaganda, iboralar darajasiga mos kelmadi. Bunday keng ko'lamli tahlilchi mavjud bo'lsa ham, ammo
Do'stlaringiz bilan baham: |