Korpus tilshunosligi bo'ladi tilni o'rganish bilan ifodalangan korpuslar "haqiqiy dunyo" matni (namunalari). Korpus tilshunosligi, tabiiy til sharoitida ("realia") to'plangan korpuslar va minimal eksperimental aralashuvlar bilan ishonchli tilni tahlil qilish maqsadga muvofiqligini taklif qiladi.
Korpus tilshunosligi sohasida korpus annotatsiyasining qiymati to'g'risida turlicha qarashlar mavjud. Ushbu qarashlar John McHardy Sinclair, minimal izohni kim qo'llab-quvvatlaydi, shuning uchun matnlar o'zlari uchun gapiradi,[1] uchun Ingliz tilidan foydalanish bo'yicha so'rov jamoa (Universitet kolleji, London), izohlashni qat'iy yozish orqali ko'proq lingvistik tushunishga imkon berish sifatida himoya qiladi.[2]
Matn-korpus usuli - bu boshqariladigan mavhum qoidalar to'plamini keltirib chiqaradigan ovqat hazm qilish usuli tabiiy til ushbu tildagi matnlardan va ushbu tilning boshqa tillar bilan qanday bog'liqligini o'rganadi. Dastlab qo'lda olingan korpuslar endi avtomatik ravishda manba matnlaridan olinadi.
Tilshunoslik tadqiqotlaridan tashqari, kompilyatsiya qilish uchun yig'ilgan korpuslardan foydalanilgan lug'atlar (bilan boshlangan Ingliz tilining Amerika merosi lug'ati kabi 1969 yilda) va grammatik qo'llanmalar, masalan Ingliz tilining keng qamrovli grammatikasi, 1985 yilda nashr etilgan.
Grammatik tavsifga oid ba'zi dastlabki harakatlar hech bo'lmaganda qisman diniy yoki madaniy ahamiyatga ega bo'lgan korpuslarga asoslangan edi. Masalan, Pratiśākhya adabiyotlarida tovush shakllari tasvirlangan Sanskritcha topilganidek Vedalarva Pokinining grammatikasi klassik sanskrithech bo'lmaganda qisman o'sha korpusni tahlil qilishga asoslangan edi. Xuddi shunday, erta Arab grammatikalari tiliga alohida e'tibor bergan Qur'on. G'arbiy Evropa an'analarida olimlar tayyorgarlik ko'rishdi kelishuvlar Injil tilini va boshqa kanonik matnlarni batafsil o'rganishga imkon berish.
Ingliz korpuslari
Tomonidan nashr etilgan zamonaviy korpus tilshunosligida muhim voqea bo'ldi Genri Kuchera va V. Nelson Frensis ning Bugungi Amerika ingliz tilini hisoblash tahlili 1967 yilda, tahliliga asoslangan asar Jigarrang korpus, turli xil manbalardan olingan millionga yaqin so'zlarni o'z ichiga olgan hozirgi amerikalik ingliz tilini sinchkovlik bilan tuzilgan. Kuchera va Frensis uni turli xil tahliliy tahlillardan o'tkazdilar, undan tilshunoslik, tillarni o'qitish elementlarini birlashtirgan boy va rang-barang opusni tuzdilar, psixologiya, statistika va sotsiologiya. Keyingi muhim nashr edi Rendolf KirkkIngliz tilidan foydalanish ta'rifiga qarab '(1960)[3] unda u tanishtirdi Ingliz tilidan foydalanish bo'yicha so'rov.
Ko'p o'tmay, Boston noshiri Xyuton-Mifflin Kučeraga yangi uchun uchta so'zli ma'lumot bazasini etkazib berish uchun murojaat qildi Amerika merosi lug'ati, birinchi lug'at korpus tilshunosligi yordamida tuzilgan. AHD retseptiv elementlarni birlashtirishning innovatsion qadamini qo'ydi (qanday qilib til kerak ishlatilishi mumkin) tavsiflovchi ma'lumotlar bilan (bu aslida qanday bu ishlatilgan).
Boshqa noshirlar ham shunga ergashishdi. Britaniyalik noshir Kollinz COBUILD bir tilli o'quvchining lug'ati, foydalanuvchilar o'rganishi uchun mo'ljallangan Ingliz tili chet tili sifatida, yordamida tuzilgan Ingliz tili banki. The Ingliz tilidan foydalanish bo'yicha so'rov Korpus korpusga asoslangan eng muhim grammatikalarni yaratishda ishlatilgan Ingliz tilining keng qamrovli grammatikasi (Quirk.) va boshq.1985).[4]
The Jigarrang korpus shunga o'xshash bir qator tuzilgan korpuslarni tug'dirdi: the LOB Corpus (1960-yillar) Britaniya ingliz tili), Kolxapur (Hind ingliz tili), Vellington (Yangi Zelandiya ingliz tili), Inglizlarning avstraliyalik korpusi (Avstraliya ingliz tiliFrown Corpus ()1990-yillarning boshlariAmerika ingliz tili) va FLOB Corpus (1990 yillar ingliz ingliz tilida). Boshqa korpuslar ko'plab tillarni, navlarni va rejimlarni anglatadi va quyidagilarni o'z ichiga oladi Xalqaro ingliz tili, va Britaniya milliy korpusi, 1990-yillarda noshirlar, universitetlar konsortsiumi tomonidan yaratilgan og'zaki va yozma matnlarning 100 million so'zlar to'plami (Oksford va Lankaster) va Britaniya kutubxonasi. Zamonaviy amerikalik ingliz tilida ish to'xtab qoldi Amerika milliy korpusi, ammo 400+ million so'z Zamonaviy Amerika ingliz tilining korpusi (1990 yildan hozirgi kungacha) endi veb-interfeys orqali mavjud.
Transkripsiya qilingan og'zaki tilning birinchi kompyuterlashtirilgan korpusi 1971 yilda Monreal Frantsiya loyihasi tomonidan qurilgan,[5]ilhomlantirgan bir million so'zni o'z ichiga olgan Shana PoplackOttava-Xall sohasidagi frantsuz tilida gaplashadigan juda katta korpus.[6]
Do'stlaringiz bilan baham: |