Hzamatjon RfiHlmqu kompyuter imvistikasi asoslar I иЛК: 519. 711 32. 973 R33



Download 10,2 Mb.
bet39/87
Sana08.02.2022
Hajmi10,2 Mb.
#436695
1   ...   35   36   37   38   39   40   41   42   ...   87
Bog'liq
Kompyuter lingvistikasi. 2011. A.Rahimov

M

Ms Word dasturida orfografiyani tekshirish imkoniyati cheklanganligi bois hozirgi kunda maxsus Spell Checker dasturlar yaratilmoqda. Bunday dasturlar sira^iga quyidagilarni kiritish mumkin: SpellLink Multilingual JiDQXingliz, ispan, italyan, nemis, fransuz, portugal, ukrain tillaridagi


ridagi so'zlarning imfPsini tekshirishga yordam beradi), Asytypt, Jipdlex,
kabi. Mazkur dasturlar Word dasturi ustiga qo'shimcha







aiMmjM,itf • McnwttWffisc - -i л »55 • •-:- .D;X

Insert Fr»56 1Mb ДО Wnduf "Hp v 1
1 0 i* «- v t m,T I S«.l




Sor'

.,1

■ jfcJ ' ' ' as e&> *com earn os аг an re

NctinMcttOMry;.

maquinasquereconozcanlasenquetascle 4' \ о™ j !os textos у apliquen el procedimiento m3s < adecuado. о incluso recomienden la —Ianor* —1 traduccton manual cuandose topencon * а^ооыюигу |

items
1 , bie Й]» ■ :
Рад* 1

:г*кюп * • —'
^id.dw ChшgA, I
-j AuboCotr*ct |

QWtowy Unguege: [spartih S«ln-T'w*>ond Sort jJ Г Checkgi«mi
QpOsre... | j C«*»l |








jJS £jt lf-«t F; "4 10 MOW '4-.fi-.- • IK X

Nout BEB ai 4 uMiserie fc aux resultats I commtm de \'[

" а V i «f., «т.- - О j ; | ® ~ 'ж j _": _ __ j


"/|Proreh (Fiance) SX-w.. |


Ocfconiry Len^jag»;
'П * »i«Kg»fllfiw •


' /Рй» Г








■ i ••>.-.• v-xv. А
Qft* fc* Xtew Fcrmrf loab TflbW
I * у ■ л & ^ »■ 44
6tBh Mtan ДО •' £ ""«KM-VS.?* * V*?


X



I visitator vengono accomagnati. A | ignore»
gratuitameme, da guide della !oro lingua, a»- ma net rnomenti di grancle afflusso con i

rg
"3


Г" U4»i ')K/'Wwy'
■ja в i Ра?» 1

gruppl numerosl dtlla steesa lingua, v fiddtoDtouoMry
a J

IgrwreAl


ntomi pamc
S( sve
Igrup enpte perc ristr»l

ngr 01

I


F* lm«t Iads tft> "wdow a* "

Ш

w >.! ,./ » v p. i ^n Ц«»"'"1 ;

ipelttng Qrwrnwr- -





Nuit Aree mei< Este dos pub!


IgweAl J

Hottiftcttonaryj
tecnoldgica 6 permanente e atinge tod as as Areas da sociedade, ё necesdrio que osmuseus utllizem efidentemente os meios que a


s



Change*! |
jj aeoCcgect


|fportugowTdrizi __ У0"»- }


&ction«*y Ъп&мде:
Г *>T«V. yvr-rm


J.









ЕЩ


1
zJ



J 1


Ignore
Igpore Rule Ne^t Sentence

Spelling rndGtammai: Russian (Russia)
GrapimaticaJ error;
ОРФО Агент позволяет вам по ГОРЯЧЕЙ КЛАВИШЕ проверять правописание в приложениях, не имеющих собственных средств проверки (NOTEPAD, UORDPAD и т.п.)/ включая почтовые программы.

Wcflonary language: Р Check grammar


Cteic

Suggestions;
Слишком много: ид/щиу подряд соглдснькна стыке слов. Попробуйте построит»- фрэту инд^еГ"
|Russian (Russia) Options... {
Und


o




ШВ

Document ■ WordPad
Ffc £<*t Insert Fgr та» Це1р
DtfB dQi й ? ^
^rteJ V ■ 1С v We it e




3§xi

r -' uoo™-» rfeittwl

Coning >s tne. creation or mumpie copies it a single moiecui„. cell orvims Thereare-nenydifferenrki.idsofd'.."ng ,nostof Much are now commonplac n science Cloning hai allowed sciei lists to develop no«verf"l лел dugs and to produce Щ5ИЧ

thee

Chock Spelling

Ian
Г (a
fo
e

inno< unrf- SO rep: skn., begi
extri

Nd in Detonaiу Ipm j

W" IflnoraA" 1
5ум«!ют ^^ |

jnduine j £hange j
ruin " **'.
Change
AddiffOfdita ■••j

Undp I Qpi^ro 1 Qictiona»»*. .| Meip... j C*nc«l |




Kompyuter lingvistikasining muhim yo'nalishlaiidan yatia bin infor- matsion qidiruv tizimlari (IQT) hisoblanadi. Ular foimal belgilarga ko'ra informatsiyani qidirishga mo'hailangan IQTlar qu>idagi bosq-ehlar aso­sida ishlaydi:



  • informatsiyani jamlash;

  • informatsiyani klassifikal siya qilnh;

  • hujjatning qidiruv obrazi (HQO)ni varatish;

  • hujjatning qidiiuv obrazi va huijatlarni saqlash;

  • qidirish va natiiani chiqarish.

«Informatsion qidiruv» (inglizcha «information retrieval») termini 1948- yilda Kelvin Mur tomonidan fanga kiridlgan.57 Informatsion qidiruv uzimi - bu ma'lumotlarni qisqa vaqt 1 Wigi ichida qidirib topi: h, kerakh hujjatlar ni ma'lumotlar bazasidan topishr.i optimallashtirish iL'miair. Bu yo'nalish llmiy-texnikaviy axborotlarni.ig ko'pay.b ke. ishiga javoban 1960->il oxir- larida yuzaga keldi. Axborot ko'paygan san uni saralash, kerakh iini qidi rib topish muammosi yuzaga keldi Mazkur muammoni bartaraf etish uchun ohmlar informatsion qidiruv ti/unlari g'oyasir.i taklif etdiiar Bu yo'nalish Internet tarmog'i yuzaga kelgandan so'ng yanada rivcjland Masalan, bu- gun hammaga ma'lumki, Internetda Goog'e. Yandt Rambler Yahoo kabi qidiruv tizimlari mav'ud.
Informatsiyani qidirish quyidagi 4 bosqichn o'z ichiga olaai

  • informatsiyaga bo'lgan talabm amalash'iiish hamda i lformatsion so'rovni shakllantiiish;

  • so'ralgan infoimatsiya saqlangan manbalarni (informatsion massiv larni) aniqlash;informatsion massivlardan zaruriy informatsiyani ajratib olish;

  • informatsiya bilan tanishish va qidiruv nalijalarini baholash.

Qidiruvning quyidagi turlari mavjud:

    1. To'liq matnli qidiruv - hujjatning to'liq mazmun-mundarijasi asosida amalga oshiriladigan qidiruv. Masalan, lnternetdagi qidiruv tizimlari:

    2. Metama'lumotlar bo'yicha qidiruv - hujjatning muayyan atributlari (hujjat nonti, yaratilgan v^qti, hajmi, muallifi) asosida amalga oshiriladi­gan qidiruv. Qidiruvning bu turiga MS Windows tizimida fayllar bilan ishlashda foydalaniladigan qidiruv dialogi misol bo'la oladi.

    3. Tasvir qidiruvi - tasvirning mazmuni asosida amalga oshiriladigan qidiruv. Bunda qidiruv tizimi rasmning mazmunini taniydi va natijada shun­ga o'xshash rasm topiladi. Polar Rose, Picollator qidiruv tizimlari mana shu tamoyil asosida ishlaydi.

    4. Multimediali informatsiya qidiruvi - bunda audio va videofayllar bo'yicha qidiruv tushuniladi.

Qidirish jarayoni turli metodlar asosida yuz beradi: manzilli qidiruv, semantik qidiruv, hujjatli qidiruv, faktografik qidiruv. Manzilli qidiruv so'rovda ko'rsatiladigan sof formal belgilar bo'yicha hujjatlarni qidirish jarayoni bo'lib, bunda hujjatning aniq manzili ko'rsatilishi lozim. Hujjat­ning manzili web-server va web-sahifa manzili yoki bibliografik qayd ele- mentlari va hujjat saqlangan joy sanaladi. Semantik qidiruv hujjatlarlar- ning mazmuni asosida qidirish usuli bo'lib, bunda hujjatning umumlashma mazmuni, sarlavhasi deskriptor ko'rinishida shakllantirilishi lozim. Hujjat­li qidiruv matnli ma'lumotlar hamda ular haqidagi bibliografik qaydlarni qidirish jarayonidir. Faktografik qidiruv so'rovda nazarda lutilgan ma'lumotga mos keluvchi faktlarni (matnli hujjatlar tarkibidan ajratilgan ma'lumotlar) qidirish jarayonidir. Yuqoridagilardan kelib chiqib aytish mumkinki, qidiruv tizimi relatsion ma'lumotlar bazasida hamda gipertekst- li ma'lumotlar bazasida mavjud bo'lgan hujjatlar, hujjatlar haqidagi metama'lumotlar, matnlar, rasmlar, video va audiofayllarni qidirishni o'z ichiga oladi.
Informatsiyaning eksponensial tarzda ko'payib ketayotganligi, shu- ningdek, Internet tizimida ham kundan kunga ma'lumotlar hajmining o'sib borayotganligi kompyuter lingvistikasi oldiga bir qator vazifalarni ko'ndalang qo'ymoqda:

  • qidiruv tizimining optimal modellarini yaratish;

  • hujjatlarni tasniflash (klassifikatorlar tizimini yaratish);

  • hujjatlarni klasterlash;

  • foydalanuvchi interfeyslari va qidiruv tiz'mlan arxitekturasim loyi- halash;

  • zaruriy informatsiyani ajratib olish. hujjatlarni avtomatik referatlash va annotatsiyalsh;

  • dcskriptorli tillar va tezauruslarm mukammallashtirish, boyitish Saqlangan ma lumotning hamda qidirish xususiyatiga ko'ra informat­sion qidiruv tizimlari 2 katta guruhga bo'li ladi: hujjatli va faktografik IQT. Hujjath IQIlarda matn, tavsif va ta'riflar saqlanaui, faktografik IQTlar esa jadvallar, formulalar, grafik ko'i imshidagi ma'lumotlarni o'z .chiga oladi. Shuningdek, aralash tabiatli IQTlar ham mavjud bo'lib, unda ham hujjatli, ham faktografik ma'lumotlar saqlanadi. IQTda qidiruvni ta'minlash uchun maxsus informatsion qidiruv tillari mavjud. Informatsion q^hruv tillari bu formal til bo'lib, u IQTda saqlangan huijatlarnmg mazmunini tavsiflash va so rov uchun moijallangan. Informat aon qidiruv tilida hujjatlarga ishlov berish protsedurasi indekslash deb ataladi. Indekslash na' ijasida har bu huj- jatga IQTdagi ta'rif shakli yoziladi. Mazkur ko'p bosqichli jarayonda deskriptorli informatsion qidiruv tillari ishlatiladi Hujjat mavzusi deskrtp- torlarning birlashuvi bilan yoziladi. Deskriplorlar sifatida so'zlar, termin- Iar, muayyan sohadagi boshlang'ich tushuncha va kategoriyalardan foy­dalaniladi Deskiiptorlarni kalit so zlar deb nomlash ham mumk"\ Deskrip torli til bilan ishlaydigan tizimlardan bin M.Taube tomonidan yaratilgun UNITERM tizimidir. Bu tizimda desknptorlar sifatida hujjatning kalit so'zlari - unitermlar ishlatiladi. Demak, muayyan sohanmg terminologiya- si, ya'ni desknptorlar qidiruv tizimi va tezauruslarning asosim tashk il etadi.

Matnning asosiy mazmun-mundanjasim aks ettiradigan kabt so'zlar, terminlar, tayanch tushunchalar bazasi asosida kompyuterda lug'at tuzila di Bunday lug'at informatsion qidiruv tezauruslari deb ataladi. lezauruslar ensiklopedik va iz.ohli lug'atlardan farqli ravishda til birhklanriing matnda qo'llanish chastotasi va matnning predmet mundanjasiiii aks ettirish dara- jasiga qarab tuziladi. Bunda termmning mazmuniy tavsifi orqali bazadagi ma'lumotlar qidirihshiga mo'ljallangan bo'lad.. 1 ern ilar tezaurusga qat ly semantik prinsiplar asosida kirit.ladi, bunda ularn gipo-geperonimik (tur- jins), holo-tneronik (butun-bc'lak), lyerarxik (pog'onali) munosabatlar hamda assotsiativ mazmuniy bog'lanishlari e'*iborga olmishi iozim. Masalan, Wikipedia sahifasidan «tezaurus» terminimng tavsifini olaylik
Te taypyc (от греч. 0>]rsaupdq - сокровище) в современной лингвистике- - особая разновидность словарей общей или специальной лексики, в ко­торых указаны семантически£ отношения {синонимы, антони мы. aaz ранимы, гипонимы, гиперонимы и т п. j между лексическими единицами.
Таким образом, тезаурусы, особенно в электронном формате, являют­ся одним из действенных инструментов для описания отдельных пред­метных областей.
В отличие от толкового словаря, тезаурус позволяет выявить смысл не только с помощью определения, но и посредством соотнесения слова с другими понятиями и их группами, благодаря чему может использо­ваться в системах искусственного интеллекта.
В прошлом термином тезаурус обозначались по преимуществу сло­вари, с максимальной полнотой представлявшие лексику языка с приме­рами её употребления в текстах.
Также термин тезаурус употребляется в теории информации для обозначения совокупности всех сведений, которыми обладает субъект.
вистики | Уровни языка
Тезаурусы

  • Амара-коиш (Словарь Амары) - первый и наиболее важный санск­ритский тезаурус (III - IV век)

  • Первым тезаурусом в современном смысле слова стал английский (XIX век, около 15 ООО синсетов). ь: многоязычный свободно пополняемый словарь и теза­урус (2004-наст.вр., проект фонда Викимедиа, в Русском Викисловаре (дамп - январь 2009) содержится 250 тыс. понятий, 67 тыс. отноше­ний^ )

  • РуТез - тезаурус русского языка (был создан Центром информаци­онных исследований как инструмент для автоматического индексиро­вания; разрабатывается с 1997 года по настоящее время, 45 тыс. поня­тий, 107 тыс. слов и выражений, 177 тыс. отношений)

См. также
Русский семантический словарь
Ссылки

  • www.thesaurus.com - Тезаурус английского языка

  • Захаров Н.В., Луков А.В. Школа тезаурусного анализа //Знание. тимание. Умение. 2006. № I. - С. 231 - 233.

  • Лесников С В.. Лесникова Д.С. Информационно-поисковый тезау-

рус
(в статье делается заклю­чение о фракталыюсти тезауруса лишь на основании перевода слова «фрактал» )
уках
Virtual ensik lopedi; sanalgan W'ikipediada keltirilgan «tezaurus» so'ziga bag'ishlangan lug'at maqolasida semantik munosabatlar, assotsiativ bog'lanishlar hamda iyerarxiya munosabati yaqqol ko'zga tashlanadi Shu o'rinda ta'kidlash zarurki, keyingi paytlarda qid ruv tizimlari bazasidagi tezauruslar giperhavolalar bilan ham ta'minlanmoqda, bu esa userga bir- muncha qulayhklar yaratadi. Ya'ni qidir layotgan terminlarga aloqador bo'lgan boshqa yaqin tushunchalar bilan hug'liq ma'lumotlarni ham oson lopish imkomni beradi
Ilm-fan, texnika taraqqiyot intensr, ravishda rivojlanyotgan bu davrda terminlar d'naniikasiiii e'tiborga olgan holda tezauruslar bazasini muttasil to'ldirib. boyiti^ bonsh zarur. Chunk- til ochiq dinamik tizim hamdajamiyat taraqqiyot ning «barometric hboblanadi. ya'ni ayrim tushunchalar eskna- di, ularning o'rniga yangi tushuncha va terminlar yuzaga keladi Informat­sion qidiruv tezauruslar yaratishda mana shuni doimo e'tiborga olish lozim. Xalqaro JgVFOTLRM (Xalqaro terminologik markaz, Avstriya) tashkiloti ma'lumotiga ko'ra, hozirgi kunda tillardagi tern- inlar miqdon 5" mln, mah- sulot nomlari nnqdori 100 mln ni tashkil etadi. Lekin ushbu statistik ma'lumot turg'un emas? u jamiyat taraqqiyoti bilan yonma-yon o'zgarm turadi.
Kompyuter lingvistikasida inqilobiv o'zgarish vasagan yangilik gipertekst texnologiyasi hisoblanadi. Chunki bu tizim Guttenberg asos sol- gan kitob bosish texnologiyasiga zid ravishda yangi turdagi matn struktu- rasini vuiudga keltirdi. Gipertekst g'oyasi AQSH prezidenti Ь Ruzveltning fan va ta'l.m bo'ViCha maslahatchisi Vannevar Bush nom oilan bog'liq bo'lib, u foydalanuvchija matn va uning fragmentlaiim turli assotsiativ munosabatlar asosida bog'lashga lmkon beruvchi «MEMEKS» tiziirim nazariy jihatdan asoslab berdi. U 1945-yilda «The Atlantic Monthly» jur- nalida «Memeks» deb atalgan kelajakdagi xayoliy qurilma haqida «As We May Think» («Biz o'ylaganimiz kabi») nomli maqolasini e'lon qildi. V Bush o'sha qu r,lma li kutubxonadajj.i har qanday hujjatlar, yozishmalar, kitob- larni displeyda ko'rsa id bera oladigun, cheklanmagan mikrofilmlarga ulan- gan elektromexanik stol sifatida tasvirlaydi. Kompyuter texnikasi yo'qligi bois lovihaning amalda qo'llanishi bii oz keyinga surildi.
Bushuing g'oyasi gipertekst haqidagi nazariv va amaliy lzlanishlai mda katta ta'sir ko'rsatdi. Bushning kelajak loyihasi 1960-yilda T.Nelsonning«Ksanadu» tizimi orqali qayta ko'tarildi. Bu texnik tizim kiritilgan matn larni va uning qismlarini turli xp usullarda, har xil qatorda ixtiyoriy ket- ma-ketlikda o'qishga rnikon beradi. Bu esa ko'rilgan matnlarning o'rnini, ketma-ketligr..i eslab qolishga va xohlagan vaqtda o'zingiz uchun kerakli matnni tanlab onshga va tezkor murojaat etishga yordam beradi Bunday xususiyatgaega bo'lgan matnlarni T.Nelson gipertekst deb nomladi. 1968- yil dekabrda amerikalik olim Duglas Engelbart ham o'zi yaratgan gipertekst .nterfcysini e'lon qildi. Olim um «The Mother of All Demos» deb atadi. 1983-"ilda Ben Shneyderman ham o'z gipertekst loyihasim varatdi, ushbu loyiha The Interactive Encyclopedia System (TIES) deb nomlan- gan.58 1 9 9 2-yilda birinchi marta gipertekst World Wide Web (xalqaro to'r)ga tatbiq ctildi.
Gipertekst yunoncha «hyper» - «ostida», «orqas.da», «ortidan» ma'nola ni anglatuvchi old qo'shimcha hamda lotincha «ieksi»-«io"qima» ma'nosini anglatuvchi so'zlardan olingan.59 1965-yilda gipertekst va giper- media terminlari T.Nelson tomonidan fanga kiritildi. Olim bu haqda o'zining «Litarary Machines» kitobida shunday yozadi: «Gipertekst termini giper- media terminiga qaraganda keng ommalashib ketdi. Aslida har ikki termin bir tushunchani unglatmaydi. Ya 'ni gipertekst faqat matnlarning tarmoqla- nishiga nisbatan ishlatiladi gipermedia termini esa grajik lar, audio va video- fayllar, shuningdek matnlarning shaxobchalanishini ham o'z ichiga oladi bi muddat har ikki termin о 'rniga «interaktiv multimedia» atamasi ham ish la ti Id*. Lekhi negadir gipertekst termini hammasidan ko 'ra keng e 'tirof etildi va ommalashdi» M
Gipertekst bu shunday matnki, u kornpyuterda boshqa matniarga gipcr- havolalar yordamida bog'lashga imkon beradi Bunda u o'quvchiga faqat matnlar ustida emas, balki turli xil jadvallar, sxemalar, rasmlar, videoro- Iiklarda ham erl in navigatsiya qilish imkonini beradi. Asosan. gipertekst World Wide Web (Xalqaro o'rgimchak to'ri) strukturasini ko'rsatuvchi tushuncha bo'lib, u orqali Internet ti/imiua informatsiya tarqalishida qulay- lik, osonlik, optimallik ta'rninlanadi. Internet olami virtual olam sanalgani uchun biz undagi bir.nchi olamdan ikkincni olamga hech qanday to'siqlarsiz o'ta olamiz. Mana shu \ irtuallikni bizga ta'minlab beruvchi tizim gipertekst g oyasidi . Internet saytiar manzihni ko'rsatishda HI TP dan foydalana- m.z (Hyper Text Transfer Protocol - Giper matnni o'tkazish vo'lagi).
lekst va gipeitekst tushunchalari o'rta: dagi farqni quyidagicha umumlashtirisb mumkin.
13-jadval


Download 10,2 Mb.

Do'stlaringiz bilan baham:
1   ...   35   36   37   38   39   40   41   42   ...   87




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish