So'zlar darajasini tahlil qilish
Matndan nutqqa tizimlarni yaratish uchun dastlabki urinishlar to'g'ridan - to'g'ri harfdan tovushga kashf etishga intildiharf satrlari va fonema ketma-ketliklari o'rtasidagi munosabatlar (Venezkiy, 1970). Afsuski, yuqorida ta'kidlab o'tilganidek, lingvistik tahlilga ehtiyoj bor va natijada cheklovchi leksikaga ehtiyoj bor. Ushbu lug'at bir necha usulda qo'llaniladi. Qarzga olingan chet el so'zlari, masalan, "parfait" va "tortilla" asl talaffuzini saqlab qoladi va ularni olib kiradigan tilning harflar bilan tovush qoidalariga rioya qilmaydi. Shuningdek, yopiq sinf (funktsiya) so'zlari talaffuzi bo'yicha ochiq sinf so'zlaridan farq qiladi. Shunday qilib, "f" ning "of" harfi ovozli simlar bilan talaffuz qilinadi, "tom" singari ochiq sinfdagi so'zlarda "f" ning ovozi yo'q. Xuddi shunday, "a" in "have" ham boshqacha talaffuz qilinadi "o'zini tutish" so'zidagi "a" va boshqa ochiq sinf so'zlaridan ko'ra. Ushbu tez-tez uchraydigan funktsional so'zlarni leksikonga joylashtirish mantiqan to'g'ri keladi, aks holda ular talaffuz qoidalarining har qanday to'plamini bejizga qiyinlashtirishi mumkin. Agar lug'atda bo'lsaso'zlar emas, balki morflar (mavhum morfemalarning yuzaki matnli realizatsiyasi), keyin tegishli fonemani aniqlash uchun ishlatilishi mumkin bo'lgan matn harflari qatorlarini chegaralaydigan so'zlar ichida morf chegaralarini aniqlash uchun algoritmlarni kiritish mumkin (Allen va boshq., 1987; Allen, 1992). ketma-ketliklar. Shunday qilib, "ea" harflari qatorida "yetish", "yirtish", "biftek" va "terida" ko'p uchraydigan talaffuzlar mavjud, ammo "o'zgaruvchan" tarkibidagi "ea" ichki morf chegarasi bilan buzilgan va shuning uchun "ea" talaffuz qilish uchun unli digraf sifatida ishlamaydi. Xuddi shunday, "dither" dagi "th" undoshlar klasteri sifatida ishlaydi, ammo "issiqxona" da "t" va "h" o'rtasida morf chegarasi mavjud. shu tariqa klasterni buzish. Bu barcha sabablarga ko'ra morf leksikasi zarur va zarurdir
Конец формы
har qanday inglizcha so'zning talaffuzini aniqlaydigan algoritmlar . Bundan tashqari, zamonaviy leksikonlar barcha so'zlarning 99 foizidan ortig'ini "qamrab oladi" va keyinroq muhokama qilinadigan xat-tovush qoidalariga qaraganda ancha aniq talaffuzlarni ta'minlaydi.
Morf leksikani hisobga olgan holda, so'z darajasidagi lingvistik tahlil har bir so'zning tarkibiy morfemalarini (va morflarini) topishdan iborat. Ushbu birliklar yuqorida aytib o'tilganlardan tashqari bir qator qimmatli xususiyatlarga ega. Morfemalar - bu tilning atomik minimal sintaktik birliklari va ular tilda juda barqaror , chunki yangi morfemalar kamdan-kam kiritiladi, mavjudlari esa tildan kamdan-kam tushiriladi. Ushbu morfemalar katta generativ kuchga egaso'zlarni yaratish, shu bilan berilgan hajmdagi morf leksikasi hech bo'lmaganda kattaroq tartibda ko'proq so'zlarni qamrab olishi mumkin. Bundan tashqari, yuqorida aytib o'tganimizdek, ko'plab til hodisalari faqat morf chegaralarida tarqaladi va muntazam ravishda qo'shib qo'yilgan so'zlar (masalan, "huquqli") va oddiy qo'shma so'zlar (masalan, "qor tozalash") leksik morfemalar bilan osonlikcha qoplanadi .
O'zlarining tarkibiy morfemalarini ochish uchun so'zlarni ajratish (Allen, 1992; Allen va boshq., 1987) - bu vokalik qo'shimchalarning mutatsion ta'sirini tan olishi kerak bo'lgan qiziqarli rekursiv jarayon. Bir nechta bunday o'zgarishlar mavjud, masalan, "fit + ed" dan "o'rnatilgan" ni hosil qilish uchun ikki baravar ko'payish, "shaharlar" da "y" ning "i" ga "city + es" dan o'zgarishi va oxirgi sukunatni tiklash. "e", "bo'g'ish + ing" dan "bo'g'ilish" kabi. Shuni e'tiborga olingki, ushbu holatlarning har birida qo'shimchaning birinchi harfining vokal tabiati morf tarkibida sodir bo'layotgan mutatsiyani keltirib chiqaradi va aynan shu o'zgarish Bir so'zda tarkibiy leksik morflarni tanib olish uchun bekor qilinishi kerak, bu mutatsiyalar keltirib chiqaradigan qiyinchiliklardan tashqari, so'zlarning morflarga bo'linishi noaniq bo'lib chiqadi, shuning uchun, masalan, "kamlik" ni "chandiq + shahar", "kamyob + qichqiriq" yoki "chandiq + keltirish + y" qoplashi mumkin. Yaxshiyamki, birikmalardan ko'ra biriktirilgan shakllarni afzal ko'rgan oddiy test to'g'ri tahlilni to'g'ri tanlashi mumkin. Ushbu testlarning sirt morf qoplamasiga emas, balki qismning mavhum morfemik tuzilishiga taalluqli ekanligi qiziq. Masalan, "tishlarni tishlash" ni "tish + ing" va "tish + ing" ga ajratish mumkin, ammo oxirgi tahlilda "tishlar" allaqachon biriktirilgan shakl ("tish" + PLURAL) bo'lib, tahlil sinovlari afzalroq bo'ladi faqat bitta burilishni o'z ichiga olgan oddiyroq oldingi tahlil. Morfemik tahlil qilish bo'yicha keng tajriba,
Do'stlaringiz bilan baham: |