56
gacha bo
ʻ
lgan ko
ʻ
plab korpuslar ham turli diniy muqaddas
kitoblar bilan bog
ʻ
liq. Ular orasida
eng mashhuri Injil matnlari, ular atroflicha tadqiq etilganligi bilan ajralib turadi. Injilga asoslan-
gan she‘rlar ko
ʻ
rsatkichiga ega so
ʻ
zlar ro
ʻ
yxati
simfoniya
yoki
konkordans
degan nom bilan
ma‘lum bo
ʻ
la boshladi. Bunday korpus ilk marotaba XIII asrda paydo bo
ʻ
ldi. Kompyuter asri-
gacha bo
ʻ
lgan korpus lingvistikasining yana bir davri XVIII-XIX asr, bu leksikografiya taraq-
qiyoti, lug
ʻ
atlar yaratilishi bilan bog
ʻ
liq. Bugungi kunda mashhur sanalgan lug
ʻ
atlarning aksa-
riyatini muallif illyustrativ korpus sanalgan kartotekaga asoslanib tuzgan. Bu korpuslar
―Kartoteka‖ yoki ―Lug
ʻ
at bo
ʻ
limi‖ deyiladi. Bunday kartoteka bilan ishlash natijasida Webster
lug
ʻ
ati (1828), V.Dalning ―Buyuk rus tilining izohli lug
ʻ
ati‖ dunyo yuzini ko
ʻ
rdi. XIX-XX asr-
larda xorijda shakllangan bu tamoyilni korpus lingvistikasi o
ʻ
z metodologiyasiga aylantirdi.
Zero, korpus lingvistikasining predmeti – til me‘yori emas, odatiy, rasmga aylangan til. Shved
olimi O.Espersen (1946) birinchilardan bo
ʻ
lib, preskreptiv (me‘yoriy) grammatikadan deskriptiv
(tafsifiy) grammatikaga o
ʻ
tish haqidagi nazariyani e‘lon qildi.
Asosiy korpuslar
1961-yil: Braun korpusi (AQSH), 1 mln. so
ʻ
z (15 ta janr asosoda tuzilgan)
1970-yil: LOB (Laankaster Oslo Bergan.J.Lich) korpusi (Вuyuk Britaniya va Norvegiya
kompyuter markazi), 1 mln. so
ʻ
zdan iborat ( korpus uchun matnlar kitob va gazetalardan
olingan). Ilk bor kompyuterda razmetkalsh metodi qo
ʻ
llangan.
Rus tilining birinchi katta korpusi -Uppsala rus tili korpusi (Shvetsiya), 1 mln. so
ʻ
zdan
iborat (1960-1988-yilgacha bo
ʻ
lgan badiiy matnlar, 1985-1988-yilgacha bo
ʻ
lgan axborot
matnlaridan tuzilgan).
Rus tilining birinchi ochiq korpusi 1999-yil (Germaniya) Tyubingen korpusi,14 mln.
so
ʻ
zdan iborat.
Rus tilining milliy korpusi, 140 mln.
Oxford English corpus, 2 mlrd.
2000 yillar:
•
American National Corpus (Amerika milliy korpusi) − 100 million so
ʻ
z.
•
Zamonaviy Amerikancha ingliz tili korpusi (Corpus of Contemporary American English) −
400 million so
ʻ
z.
•
Rus tili milliy korpusi − 140 million so
ʻ
z.
•
Gigaword corpora: ingliz, arab, xitoy tillari − 2 milliard so
ʻ
z.
•
Oxford English corpus (Oksford ingliz korpusi) − 2 milliard so
ʻ
z.
Korpusning ijtimoiy ahamiyati – keng qamrovlidir. Korpusdan lingvistik, etnopsixoling-
vistik tadqiqotlarda, ona tili va adabiyoti, xorijiy til ta‘limida, matnga avtomatik ishlov berish,
tarjima dasturlarini tuzishda foydalanish mumkin. Korpus – tilshunos, tarjimon, o
ʻ
qituvchi,
dasturchi, jurnalist, muharrir, umuman, kundalik faoliyati jarayonida ―ish quroli so
ʻ
z bo
ʻ
lgan‖ har
qanday kishi uchun zamonaviy axborot vositasining bir ko
ʻ
rinishi. Demak, korpusning paydo
bo
ʻ
lishi, rivojlanishi ikki bosqichdan iborat. Birinchi davr korpusi – kartotekalar to
ʻ
plamidan
iborat, garchi bugungi korpus ko
ʻ
rinishida bo
ʻ
lmasa-da, lingvistik tadqiqot uchun material vazi-
fasini o
ʻ
tagan. Ikkinchi davri- Kompyuter asrida esa ular elektron shaklga kirdi, dasturlashtirildi.
Do'stlaringiz bilan baham: