Korpus lingvistikasi nima korpuslardan foydalanish muayyan sohalardan olingan korpuslar



Download 44,46 Kb.
bet2/3
Sana13.04.2022
Hajmi44,46 Kb.
#549241
1   2   3
Bog'liq
KORPUS YARATISH MUOMMOLARI

Korpus tilshunosligi bo'ladi tilni o'rganish bilan ifodalangan korpuslar "haqiqiy dunyo" matni (namunalari). Korpus tilshunosligi, tabiiy til sharoitida ("realia") to'plangan korpuslar va minimal eksperimental aralashuvlar bilan ishonchli tilni tahlil qilish maqsadga muvofiqligini taklif qiladi.
Korpus tilshunosligi sohasida korpus annotatsiyasining qiymati to'g'risida turlicha qarashlar mavjud. Ushbu qarashlar John McHardy Sinclair, minimal izohni kim qo'llab-quvvatlaydi, shuning uchun matnlar o'zlari uchun gapiradi,[1] uchun Ingliz tilidan foydalanish bo'yicha so'rov jamoa (Universitet kolleji, London), izohlashni qat'iy yozish orqali ko'proq lingvistik tushunishga imkon berish sifatida himoya qiladi.[2]
Matn-korpus usuli - bu boshqariladigan mavhum qoidalar to'plamini keltirib chiqaradigan ovqat hazm qilish usuli tabiiy til ushbu tildagi matnlardan va ushbu tilning boshqa tillar bilan qanday bog'liqligini o'rganadi. Dastlab qo'lda olingan korpuslar endi avtomatik ravishda manba matnlaridan olinadi.
Tilshunoslik tadqiqotlaridan tashqari, kompilyatsiya qilish uchun yig'ilgan korpuslardan foydalanilgan lug'atlar (bilan boshlangan Ingliz tilining Amerika merosi lug'ati kabi 1969 yilda) va grammatik qo'llanmalar, masalan Ingliz tilining keng qamrovli grammatikasi, 1985 yilda nashr etilgan.
Grammatik tavsifga oid ba'zi dastlabki harakatlar hech bo'lmaganda qisman diniy yoki madaniy ahamiyatga ega bo'lgan korpuslarga asoslangan edi. Masalan, Pratiśākhya adabiyotlarida tovush shakllari tasvirlangan Sanskritcha topilganidek Vedalarva Pokinining grammatikasi klassik sanskrithech bo'lmaganda qisman o'sha korpusni tahlil qilishga asoslangan edi. Xuddi shunday, erta Arab grammatikalari tiliga alohida e'tibor bergan Qur'on. G'arbiy Evropa an'analarida olimlar tayyorgarlik ko'rishdi kelishuvlar Injil tilini va boshqa kanonik matnlarni batafsil o'rganishga imkon berish.

Ingliz korpuslari


Tomonidan nashr etilgan zamonaviy korpus tilshunosligida muhim voqea bo'ldi Genri Kuchera va V. Nelson Frensis ning Bugungi Amerika ingliz tilini hisoblash tahlili 1967 yilda, tahliliga asoslangan asar Jigarrang korpus, turli xil manbalardan olingan millionga yaqin so'zlarni o'z ichiga olgan hozirgi amerikalik ingliz tilini sinchkovlik bilan tuzilgan. Kuchera va Frensis uni turli xil tahliliy tahlillardan o'tkazdilar, undan tilshunoslik, tillarni o'qitish elementlarini birlashtirgan boy va rang-barang opusni tuzdilar, psixologiya, statistika va sotsiologiya. Keyingi muhim nashr edi Rendolf KirkkIngliz tilidan foydalanish ta'rifiga qarab '(1960)[3] unda u tanishtirdi Ingliz tilidan foydalanish bo'yicha so'rov.
Ko'p o'tmay, Boston noshiri Xyuton-Mifflin Kučeraga yangi uchun uchta so'zli ma'lumot bazasini etkazib berish uchun murojaat qildi Amerika merosi lug'ati, birinchi lug'at korpus tilshunosligi yordamida tuzilgan. AHD retseptiv elementlarni birlashtirishning innovatsion qadamini qo'ydi (qanday qilib til kerak ishlatilishi mumkin) tavsiflovchi ma'lumotlar bilan (bu aslida qanday bu ishlatilgan).
Boshqa noshirlar ham shunga ergashishdi. Britaniyalik noshir Kollinz COBUILD bir tilli o'quvchining lug'ati, foydalanuvchilar o'rganishi uchun mo'ljallangan Ingliz tili chet tili sifatida, yordamida tuzilgan Ingliz tili banki. The Ingliz tilidan foydalanish bo'yicha so'rov Korpus korpusga asoslangan eng muhim grammatikalarni yaratishda ishlatilgan Ingliz tilining keng qamrovli grammatikasi (Quirk.) va boshq.1985).[4]
The Jigarrang korpus shunga o'xshash bir qator tuzilgan korpuslarni tug'dirdi: the LOB Corpus (1960-yillar) Britaniya ingliz tili), Kolxapur (Hind ingliz tili), Vellington (Yangi Zelandiya ingliz tili), Inglizlarning avstraliyalik korpusi (Avstraliya ingliz tiliFrown Corpus ()1990-yillarning boshlariAmerika ingliz tili) va FLOB Corpus (1990 yillar ingliz ingliz tilida). Boshqa korpuslar ko'plab tillarni, navlarni va rejimlarni anglatadi va quyidagilarni o'z ichiga oladi Xalqaro ingliz tili, va Britaniya milliy korpusi, 1990-yillarda noshirlar, universitetlar konsortsiumi tomonidan yaratilgan og'zaki va yozma matnlarning 100 million so'zlar to'plami (Oksford va Lankaster) va Britaniya kutubxonasi. Zamonaviy amerikalik ingliz tilida ish to'xtab qoldi Amerika milliy korpusi, ammo 400+ million so'z Zamonaviy Amerika ingliz tilining korpusi (1990 yildan hozirgi kungacha) endi veb-interfeys orqali mavjud.
Transkripsiya qilingan og'zaki tilning birinchi kompyuterlashtirilgan korpusi 1971 yilda Monreal Frantsiya loyihasi tomonidan qurilgan,[5]ilhomlantirgan bir million so'zni o'z ichiga olgan Shana PoplackOttava-Xall sohasidagi frantsuz tilida gaplashadigan juda katta korpus.[6]

Download 44,46 Kb.

Do'stlaringiz bilan baham:
1   2   3




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish