Samarqand davlat universiteti Filologiya fa’kulteti 206-guruh talabasi Aliboyeva Layloning “Kompyuter lingvistikasi” fanidan mustaqil ta’lim taqdimoti



Download 94,01 Kb.
Sana07.01.2022
Hajmi94,01 Kb.
#325643
Bog'liq
Korpus lingvistikasi

Samarqand davlat universiteti Filologiya fa’kulteti 206-guruh talabasi Rasulova Fazilatning ning “Kompyuter lingvistikasi” fanidan mustaqil ta’lim taqdimoti


Mavzu: KORPUS LINGVISTIKASI

Reja:

1. Korpus lingvistikasining shakllanishi.

2. Korpus lingvistikasining taraqqiyoti.

3. Ikkinchi avlod korpuslari.

4. Korpus lingvistikasining atamalari va tasnifi.

 

Korpus – ma’lum maqsadda yig’ilgan matnlar majmuini tashkil etuvchi til birliklari yig’indisi, tabiiy tildagi electron shaklda saqlanadigan yozma va og’zaki, kompyuterlashtirilgan qidiruv tizimiga dasturiy ta’minot asosida joylashtirilgan on-line yoki off-line tizimda ishlaydigan matnlar jamlanmasi. Til korpusi electron

Til korpusi electron kutubxonadan farqli o’laroq, tilni o’rganish uchun zaruriy, foydali va qiziqarli matnlarni to’plashni nazarda tutadi. Korpusni electron kutubxonadan ajratib turuvchi birinchi omil undagi matnnning xususiyati va qo’shimcha ma’lumotlar bilan boyitilganligi hisoblanadi va bu belgi korpusning alohida qismi – korpus birliklariga yozilgan izohni tashkil etadi.

Manbalarda ko’rsatilishicha, “Ishonarli lingvistik ma’lumotlar katta massivli matnlar majmuasidangina olinishi mumkin” degan qarash o’tgan asrning 60-yillarida R.G.Piatrovskiy tomonidan aytilgan. Aslida, korpus sohasidagi maqsadli tadqiqotlar 40-yillarda (Blumfild, Frays va Bondjers) boshlandi. Lekin 50-60-yillarda Noam Chomskiy konsepsiyasi (xomskianskaya lingvistika, chomskyan linguistics) ustunlik qila boshladi. Ushbu yo’nalish nutqiy qo’llanishni (performance, Sossyurning fikricha, “nutq”)ni emas, tilni o’rganish (competence, Sossyurning fikricha, “til”) lozim, degan g’oyani ilgari surardi. Chunki tilda nutqiy qo’llanish son-sanoqsiz, ularni o’rganish befoyda. Til mohiyati, imkoniyatini ifodalaydigan qonuniyatlar esa sanoqli, demak, ularni tadqiq etish mumkin, maqsadga muvofiq, deb hisoblangan



korpus lingvistikasining predmeti til me’yori emas, odatiy, rasmga aylangan holat hisoblanadi. Shved olimi Otto Espersen birinchilardan bo’lib preskreptiv (normativ) grammatikadan deskriptiv (tafsifiy) grammatikaga o’tish haqidagi nazariyani e’lon qildi. U real til materialini o’rganishda sun’iy ravishda tuzilgan misollardan voz kechdi. Asosiy ishi – “Modern English Grammar on Historical Prinsiples” (1909-1949) uchun maxsus misollar manbasini tanladi. Bu manbaning ro’yxati 40 sahifadan iborat, zamonaviy reprezentativ, ishonchli korpus namunasidir

Zamonaviy korpus u yoki bu til resursini qay darajada ifodalashiga, sifati, miqdoriga qarab matnlarning oddiy elektron kolleksiyasi yoki chuqur annotasiyalangan korpus kabi turga bo’linadi. Zamonaviy tilshunoslik ko’p hollarda matnni elektron shaklda ishlatish ehtiyojini sezadi, bu esa avtomatik ravishda “korpusning birinchi avlodi”ni tashkil etadi. Shuning uchun eski korpuslar “o’lmaydi”, iste’moldan chiqib ketmaydi, balki to’ldirilib, chuqurlashib, annotasiyaga (turli lingvistik tahlil) ega bo’lib boraveradi.

Kompyuter korpuslari yaratishning asosiy davrlari quyidagicha tasniflanadi:

I. 1960 yillar: Braun korpusi (AQSh) − 1 million so’z.

II. 1970 yillar: LOB korpusi (Buyuk Britaniya, Norvegiya) − 1 million so’z.

III. 1980 yillar:

1. Rus tilining mashina fondi (Mashinnыy Fond russkogo yazыka).

2. Rus tilining Upsalla korpusi (Uppsalskiy korpus russkogo yazыka. Shvesiya) − 1 million so’z.

IV. 1990 yillar:

1. British National Corpus (Britaniya milliy korpusi) –100 million so’z.

2. Milliy korpuslar (venger, italyan, xorvat, chex, yapon) 100 million so’z.

3. Ingliz tili banki (The Bank of English, Birmingham (Collins Cobuild) − 600 million so’z.

V. 2000 yillar:

1. American National Corpus (Amerika milliy korpusi) – 100 million so’z.

2. Zamonaviy Amerikancha ingliz tili korpusi (Corpus of Contemporary American English) − 400 million so’z.

3. Nasionalnыy korpus russkogo yazыka (Rus tili milliy korpusi) − 140 million so’z.

4. Gigaword corpora: ingliz, arab, xitoy tillari − 2 milliard so’z.

5. Oxford English corpus (Oksford ingliz korpusi) − 2 milliard so’z.

Xullas, korpusning paydo bo’lishi, rivojlanishi ikki bosqichdan iborat – kompyuter asrigacha bo’lgan, kompyuter asri korpuslari davri. Birinchi davr korpusi – kartotekalar to’plamidan iborat, garchi bugungi korpus ko’rinishida bo’lmasa-da, lingvistik tadqiqot uchun material vazifasini o’tagan. Kompyuter asrida esa ular elektron shaklga kirgan va dasturlashtirilgan.


E’TIBORINGIZ UCHUN RAHMAT

E’TIBORINGIZ UCHUN RAHMAT


Download 94,01 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish