PROSODIK MARKING
Sintaktik tahlil aniqlangandan so'ng, matnni prosodik xususiyatlar uchun belgilash qoladi. Bularga asosan intonatsiya, mashhurlik, kesma va gap turi kiradi. So'ngra nutqni sintez qilish protsedurasi segmentar fonetik tarkibni ushbu prosodik markerlar bilan birgalikda talqinning vaqtini va balandligini shakllantirish uchun batafsil segmental sintez bilan birgalikda talqin qilishi mumkin. Ko'pgina lingvistik effektlar ushbu prosodik xususiyatlarni aniqlashga yordam beradi. Leksik darajada ba'zi so'zlar tabiiy ravishda ta'kidlanadi. Masalan, "Hillari men uchun kukilarni tayyorlamasligi mumkin" filmida o'tgan zamon modal yordamchi "mumkin" va salbiy "emas" shubha va inkorni ifoda etadi va ishonchli tarzda ta'kidlanadi, shuning uchun ular mashhurligi bilan ajralib turadi (O'Shoughnessy va Allen, 1983). Pronominal ma'lumotnoma shuningdek, prosodik tarzda belgilanishi mumkin. Shunday qilib, "U uning yuziga tarsaki tushirdi va keyin u erkakni urdi", agar "u" va "erkak" asosiy ahamiyatga ega bo'lsa, unda "urish" obro'ga ega bo'ladi va "erkak" kamayadi. Ammo "agar" va "odam" alohida shaxslarni nazarda tutadi, keyin "odam" taniqli bo'ladi va "urish" kamayadi.Pronomional ma'lumotni to'g'ri aniqlash oddiy ibora darajasidagi sintaktik tahlilda mavjud emas va boshlanadigan keng miqyosli diskurs tahliliga tayanishi kerak. nutqdan matnga tizimlarda foydalanish kerak, ammo bu hodisalarning mavjudligi bunday tarkibiy ma'lumotlarga ehtiyoj va foydaliligini ko'rsatadi. va "odam" asosiy ahamiyatga ega, keyin "urish" mashhurlikka erishadi va "odam" kamayadi. Ammo agar "u" va "odam" alohida shaxslarga murojaat qilsalar, unda "odam" taniqli bo'lib, "urish" kamayadi. Pronominal ma'lumotnomani to'g'ri aniqlash oddiy ibora darajasidagi sintaktik tahlilda mavjud emas va matndan nutq tizimlarida qo'llanila boshlanadigan kengroq diskurs tahliliga tayanishi kerak, ammo bu hodisalarning mavjudligi zaruriyatni ko'rsatadi va bunday tarkibiy ma'lumotlarning foydaliligi. va "odam" asosiy ahamiyatga ega, keyin "urish" mashhurlikka erishadi va "odam" kamayadi. Ammo agar "u" va "odam" alohida shaxslarga murojaat qilsalar, unda "odam" taniqli bo'lib, "urish" kamayadi. Pronominal ma'lumotnomani to'g'ri aniqlash oddiy ibora darajasidagi sintaktik tahlilda mavjud emas va matndan nutqqa tizimlarida qo'llanila boshlanadigan keng ko'lamli nutq tahliliga tayanishi kerak, ammo bu hodisalarning mavjudligi zaruriyatni ko'rsatadi va bunday tarkibiy ma'lumotlarning foydaliligi.
Tahlil qilishning oldingi qismida ta'kidlanganidek, so'nggi o'n yil ichida prosodik tuzilishga katta e'tibor berilmoqda
(gapdagi so'zlarning tabiiy guruhlanishi) sintaktik tuzilishdan ajralib turadi. Ushbu ikki tuzilish o'rtasidagi munosabatlar Selkirkda (1984) lingvistik jihatdan o'rganilgan va Gee va Grosjan (1983) da tabiiy guruhlar sifatida "ishlash tuzilmalari" ga e'tibor berilgan. Ushbu tadqiqotlar samaradorlik tuzilmalari nisbatan kichik asosiy birliklarga, tabiiy ierarxiyaga ega ekanligi va natijada olingan umumiy tuzilish sintaktik tarkibiy tahlilga qaraganda ancha muvozanatli ekanligi ta'kidlandi. Ushbu tahlillarning "ishlash" jihati qo'shma tanaffuslarni sub'ektiv baholashdan foydalangan va so'z uzunligi va tarkibiy tugunlarning sintaktik yorlig'i muhim rol o'ynaganligini aniqlagan. Ushbu tabiiy guruhlar sintaktik tahlilga qaraganda tekisroq ierarxik tuzilishni ta'minlagani aniqlandi,
Gee va Grosjan (1983) tomonidan taqdim etilgan ishlash strukturasi tahlili ishlash strukturasini aniqlash uchun to'liq sintaktik tahlilni nazarda tutgan bo'lsa-da, Bachenko va Fitspatrik (1990) klauzal tuzilish va predikat-argument munosabatlari zarurligini rad etishdi. Bundan tashqari, sintaktik tuzilmani prozodika uchun zarur bo'lgan holatga o'tkazish uchun taklif qilingan "qayta sozlash qoidalari" dan voz kechildi va "nutqning betarafligi" da'vo qilingan prosodik iboralarni yaratish algoritmi taqdim etildi, bu iboralarning atigi 14 foizini tashkil etdi. o'rganilgan nutq aniqlandi. Ushbu yondashuvda fe'l iboralarini va hissiy tarkibiy qismlarni tanib olishning hojati yo'q edi: faqat otli iboralar, predlogli iboralar va sifatlovchi iboralar prozodik bo'laklarni hosil qilishda "hisoblashadi". Bu nihoyatda dalda beruvchi natija edi, chunki oldingi bobda tavsiflangan turdagi ibora darajasidagi tahlilchi kerakli birliklarni ta'minlay oladi. Prosodik iboralarni belgilaydigan (nutq-neytral) asosiy omil sifatida saylov okrugi, qo'shni va uzunlik aniqlandi. Albatta, ushbu prosodik chegaralarni ta'kidlash bilan bog'liq bo'lgan nutq iboralari yordamida o'zgartirish mumkin,
qarama-qarshilik, parallellik va yadroviylik, ammo neytral o'qish uchun zarur bo'lgan iboralarni ushbu iboraviy tahlillar yordamida to'g'ridan-to'g'ri olish mumkin.
Bachenko va Fitspatrik (1990) tomonidan kiritilgan tahlillardan so'ng, prosodik iboralar chegaralarini avtomatik ravishda hisoblashga katta qiziqish paydo bo'ldi. Ushbu texnikani qoidalar bo'yicha shakllantirishdan ko'ra, statistik metodlardan foydalanilgan. Vang va Xirshberg (1992) ushbu chegaralarni aniqlashga ta'sir qilishi mumkin bo'lgan ko'plab omillarni birlashtirish uchun tasniflash va regressiya daraxti (CART) usullaridan foydalangan (Brieman va boshq., 1984). Ostendorf and Veilleux (1993) da "break index" ma'lumotlari yordamida prosodik iboralarning ierarxik stoxastik modeli joriy qilingan va o'qitilgan. Matndan prosodik so'z birikmalarini taxmin qilish uchun maksimal darajadagi prosodik tahlilni topish uchun dinamik dasturlash algoritmi berilgan. Ushbu so'nggi tadqiqotlar juda dalda beradi, chunki ular kirish matni asosida jumlalarning prosodik iboralarini olishning istiqbolli usullarini taqdim etadi. Ushbu texnikaning dastlabki lingvistik tekshiruvlardan psixolingvistik tajribalar orqali hozirgi hisoblash lingvistik tadqiqotlarigacha bo'lgan evolyutsiyasi nihoyatda qiziq va qiziqqan o'quvchi keltirilgan adabiyotlar traektoriyasidan juda ko'p tushunchalar va tushunchalarga ega bo'lishi mumkin. Shuningdek, foydali xulosa Wightman va boshq. (1992).
Ko'p so'zli birikmalarni tahlil qilish ko'pincha qiyin, ammo to'g'ri prosodik belgilar bilan ularni qabul qilish juda osonlashadi. "Davlat tamaki narxlarini qo'llab-quvvatlash tizimi" va "energiya ishlab chiqaruvchi stantsiyani boshqarish xonalari majmuasi" ularning tuzilishini ochib berish uchun prosodik belgilarga muhtoj bo'lgan uzoq birikmalarning ikkita misoli. Ushbu misollarning aksariyati mavjud bo'lmagan semantik tahlilni talab qiladi, ammo ko'plab misollarni sinchkovlik bilan o'rganish natijasida hayratlanarli yaxshilanishlarga erishildi (Sproat, 1990; Sproat va Liberman, 1987). Chap tomonda ikkita tarkibli birikma (masalan, "yopishqoq bulochka") uchun stressni joylashtiradigan birikma stress qoidasidan foydalanish bilan bir qatorda, so'zlarni stressni bashorat qilishni osonlashtiradigan tarzda leksik ravishda terish mumkin. Masalan, "pint", "dollar" ) o'zlarining o'ng tomonidagi iboralar bilan birlashib, odatda "dollar bill" va "pint krujka" da bo'lgani kabi, o'ng elementga stressni keltirib chiqaradigan kattaroq iborani yaratishlari mumkin. Ushbu qoidalar foydali bo'lsa-da, katta aralash nominallar uchun oddiy birikma qoidasidan rekursiv foydalanishga qo'shimcha ravishda qo'shimcha evristika qo'llanilishi kerak. Kuchli stresslar o'rtasidagi to'qnashuvlarning oldini olish uchun ritm qoidasidan foydalanish mumkin. Shu tarzda "shahar hokimligi avtoturargohidagi" "Hall" dagi stress kamayadi va "shahar" ning stressi ko'tariladi, shuning uchun "to'xtash" asosiy stressni saqlab tursa, keyingi eng katta stress ikki so'z uzoqlikda, "shahar. " O'zaro ma'lumotlardan foydalanish statistika qudratining qiziqarli namunasidir. Ushbu qoidalar foydali bo'lsa-da, katta aralash nominallar uchun oddiy birikma qoidasidan rekursiv foydalanishga qo'shimcha ravishda qo'shimcha evristika qo'llanilishi kerak. Kuchli stresslar o'rtasidagi to'qnashuvlarning oldini olish uchun ritm qoidasidan foydalanish mumkin. Shu tarzda "shahar hokimligi avtoturargohidagi" "Hall" dagi stress kamayadi va "shahar" ning stressi ko'tariladi, shuning uchun "to'xtash" asosiy stressni saqlab qolsa, keyingi eng katta stress ikki so'z uzoqlikda, "shahar. " O'zaro ma'lumotlardan foydalanish statistika qudratining qiziqarli namunasidir. Ushbu qoidalar foydali bo'lsa-da, katta aralash nominallar uchun oddiy birikma qoidasidan rekursiv foydalanishga qo'shimcha ravishda qo'shimcha evristika qo'llanilishi kerak. Kuchli stresslar o'rtasidagi to'qnashuvlarning oldini olish uchun ritm qoidasidan foydalanish mumkin. Shu tarzda "shahar hokimligi avtoturargohidagi" "Hall" dagi stress kamayadi va "shahar" ning stressi ko'tariladi, shuning uchun "to'xtash" asosiy stressni saqlab tursa, keyingi eng katta stress ikki so'z uzoqlikda, "shahar. " O'zaro ma'lumotlardan foydalanish statistika qudratining qiziqarli namunasidir. kamayadi va "Siti" ning holati ko'tariladi, shuning uchun "to'xtash joyi" asosiy stressni saqlab tursa, keyingi eng katta stress "Siti" so'zidan ikki so'z uzoqlikda joylashgan. O'zaro ma'lumotlardan foydalanish statistika qudratining qiziqarli namunasidir. kamayadi va "Siti" ning holati ko'tariladi, shuning uchun "to'xtash joyi" asosiy stressni saqlab tursa, keyingi eng katta stress "Siti" so'zidan ikki so'z uzoqlikda joylashgan. O'zaro ma'lumotlardan foydalanish statistika qudratining qiziqarli namunasidir.
mumkin bo'lgan noaniq tahlillarni hal qilish uchun (Sproat, 1990). Masalan, "Wall Street Journal" ni ([Wall Street] Journal) yoki (Wall [Street Journal]) sifatida tahlil qilish mumkin, bu erda ikkinchi qism noto'g'ri "Street" ga ta'sir qiladi. Ammo 1988 yil uchun Associated Press Newswire-dan olingan korpusda "Wall Street" "Wall Street Journal" kontekstidan tashqarida 636 marta sodir bo'lgan bo'lsa, "Street Journal" ushbu kontekstdan tashqarida faqat besh marta sodir bo'ladi va shuning uchun o'zaro ma'lumot o'lchovi "Jurnal" da birinchi (to'g'ri) tahlilni va unga tegishli asosiy stressni yoqtiradi, "Uoll-strit" oddiy ikki so'zli birikma sifatida qabul qilinadi.
Albatta, jumldagi deyarli har qanday so'zni ta'kidlash mumkin va agar bu matnda pastki chiziq bilan yoki kursiv bilan belgilanadigan bo'lsa, u holda bu so'z uchun taniqli bo'lishi mumkin.
Va nihoyat, junctural signallar idrok uchun muhim yordamdir. "Bil sotib olgan it uni tishladi" bo'limida qisqartirilgan nisbiy band aniq belgilanmagan, shuning uchun "sotib olgandan" keyin tanaffus tinglovchiga ushbu ko'milgan bandning oxirini ko'rsatishi mumkin. Yaqinda ko'rsatildi (Price et al., 1991), turli xil sintaktik sinflar uchun sodda tinglovchilar prosodik ma'lumotlarning farqlari asosida ma'nolarni ishonchli tarzda ajratib olishlari mumkin. Ushbu natijalar tinglovchilarning o'qish nutqidagi mulohazalari asosida aniqlandi, bu erda noaniq materiallar katta kontekstga joylashtirilgan. Masalan, "Ular may oyining boshlarida ko'tarilishdi" degan jumla. quyidagi ikki usulda ishlatilishi mumkin:
• "Bahorda fermada har doim ko'proq ish qilish kerak edi. May oyi eng og'ir oy edi. Ular may oyining boshlarida ko'tarilishdi."
• "Ayiqlar butun qish davomida uxlaydilar, odatda aprel oyining oxirida qish uyqusidan chiqadilar, ammo bu yil ular biroz sustlashdi. May oyining boshlarida ko'tarilishdi."
Tinglovchilar tez-tez prosodik signallardan jumlalarni muvaffaqiyatli ravishda ajratib olishlari mumkinligi, ushbu belgilar asosida bir nechta mumkin bo'lgan qismlardan birini tanlash algoritmlarini yaratish uchun ishlatilishi mumkin (Ostendorf va boshq., 1993). Price et al. Tomonidan kiritilgan "tanaffus indeksi" tushunchasi (ikkita qo'shni so'zlar orasidagi birikmaning ajratilishi o'lchovi) yordamida. (1991) va statistik o'qitish protseduralari bo'yicha, nomzodning tahlil qilingan matn versiyalari prognoz qilingan prozodik tuzilmalarni sintez qilish uchun ushbu tanaffus indekslari nuqtai nazaridan avtomatik ravishda tahlil qilinadi va keyinchalik og'zaki nutqdan olingan tahlil qilingan prozodik tuzilish bilan taqqoslanadi. Bu tahlilni sintez bilan qayta ishlashning yaxshi namunasidir,
prosodik tahlil qilingan og'zaki versiyasi. Prosodik korrelyatlar (masalan, balandlik va davomiylik) kamdan-kam hollarda to'g'ridan-to'g'ri tuzilishni xulosa qilish uchun pastdan yuqoriga qarab ishlatilishi mumkin bo'lsa-da, sintez bo'yicha tahlil qilish usullari yuqoridan pastga qarab tuzilgan tuzilmalarni skoringidan foydalanib, eng katta ehtimollik bilan tahlil qilish orqali aniqlanadi.
Hozirda ushbu kodlashni yaratish uchun matnga asoslangan algoritmlar bilan birgalikda nutqni prosodik belgilash standartlari ishlab chiqilmoqda. Matnning katta korpusi shu tarzda tahlil qilinganidan va qo'lda berilgan belgilar bilan taqqoslagandan so'ng, lingvistik tahlilning umumiy doirasidagi boy yangi qo'shimchalar mavjud bo'lib, ular sintetik nutqning tabiiyligi va tushunarliligini oshiradi.
Ushbu bo'limda prosodik tuzilmani, shu jumladan prosodik chegaralarni aniqlashga e'tibor qaratildi. Ushbu tuzilma mavjud bo'lgandan so'ng, prosodik korrelyatsiya ko'rsatilishi kerak. Bunga muddatlar va umumiy vaqt ramkalari va umumiy intonatsiya konturini aks ettiruvchi asosiy chastota konturi va stressni belgilash uchun mahalliy balandlik aksanlari kiradi. Segmental davomiylikni bo'g'inlar va yuqori darajadagi birliklarga moslashtirish uchun statistik metodlar ishlab chiqilganligi ajablanarli emas (Kempbell, 1992; Riley, 1992; Van Santen, 1992). Qat'iy aksanning joylashishi, shuningdek, natijani so'zning nutq qismi va unga qo'shni so'zlar va uning katta prosodik tarkibiy qismidagi mavqei kabi omillarga asoslanib, tasniflash va regressiya daraxtlari tahlili yordamida aniqlandi (Ross va boshq., 1992) ). Ushbu uslublar, shuningdek, keyingi so'zda ta'kidlangan hece bilan ritmik to'qnashuvni oldini olish uchun aksan o'zgarishini joriy etishga qodir. Umumiy milliy kontur va balandlikni ta'kidlashni aniqlagandan so'ng, tegishli spetsifikatsiya algoritmga kirish sifatida ishlatilishi mumkin (Pierrehumbert, 1981), bu zarur chastota konturini hosil qiladi.
Do'stlaringiz bilan baham: |