ХХ асрнинг 50 йилларидан бошлаб тилшуносликда "машина таржимаси", "машина тилшунослиги" атамалари қўлланила бошланди. Бу асрнинг буюк кашфиёти бўлган компьютер технологиялари тилшуносликка ҳам кириб келганининг исботи эди. Машина таржимаси ёки автоматик таржима дейилганда бир тилдаги матнни иккинчи бир тилга ЭҲМ (компьютер) воситасида, тез вақт ичида таржима қилиш назарда тутилади. Машина таржимасининг асосчилари кибернетика ва математика соҳаси вакиллари бўлиб, кейинчалик бу ишда тилшунослар ҳам фаол қатнаша бошлаган. Шу тариқа машина таржимаси ғоялари бутун дунёда назарий ва амалий тилшуносликнинг ривожланишида катта аҳамият касб этди. Бу йўналиш билан параллель равишда формал грамматика назарияси юзага келиб, тил ва унинг алоҳида аспектлари моделини яратишга эътибор қаратилди. Тилнинг бу жиҳатлари математик лингвистика фанида ишлаб чиқилиб, бу ўз навбатида, компьютер лингвистикаси фанининг юзага келиши учун пойдевор бўлди. Демак, шу асосда тилшуносликнинг янги йўналиши бўлган компьютер лингвистикаси ва тилшуносликнинг бир қатор назарий ва амалий йўналишлари вужудга келди.
Математик лингвистика фани ХХ асрнинг 50 йилларида (1952 йилда) тилшуносликнинг алоҳида йўналиши сифатида юзага келди. Бу фаннинг шаклланишида Копенгаген структурал тилшунослик мактаби (глоссематика)нинг асосчиси Луи Елмслевнинг ғоялари ўзига хос „туртки» вазифасини ўтаган.У ҳатто тил ҳосидаларини математик баёнда тушунтирадиган фаннинг номини ҳам таклиф этган. Олимнинг фикрича, бу фан „тил алгебраси« („лингвистик алгебра») деб аталиши лозим эди. Америкалик тилшунос Ноам Чомскийнинг формал грамматика, трансформатсион грамматика ҳақиаги қарашлари бевосита математик лингвистиканинг алоҳида йўналиш сифатида юзага келишига сабаб бўлган. Мана шундай қарашлар таъсирида математик лингвистика фани шаклланди. Математик лингвистика бу – табиий тилларнинг математик моделларини (бундай формаллашган тил метатил деб аталади) ишлаб чиқиш, хусусан, сунъий тилларни яратиш алгоритмини тузиш билан шуғулланувчи фандир. Математик лингвистика олдида турувчи энг муҳим масалалар қуйидагилардир:
- тилнинг аксиоматик назариясини ишлаб чиқиш;
- формал грамматика яратиш;
- тилларнинг математик моделларини ишлаб чиқиш.
Ҳар бир фаннинг ўз мақсад ва вазифалари бўлади. Математик лингвистика фанининг асосий мақсади табиий тилларнинг математик моделини ишлаб чиқишдир. Ушбу мақсадга эришиш учун фан ўз олдига қуйидаги вазифаларни қўяди:
- табиий ва сунъий тилларнинг формал моделлари алгоритмини ишлаб чиқиш;
- лисоний ҳодисаларни математик параметрларда баҳолаш;
- тил ҳодисаларини математик методлар ёрдамида таҳлил қилиш (эҳтимоллар назарияси, статистика ва квантитатив методларни татбиқ этиш).
Компьютер лингвистикаси математик лингвистиканинг мантиқий давоми бўлиб, у амалий тилшуносликнинг энг муҳим қисмини ташкил этади. Компьютер лингвистикаси 1954 йил Ақшда Жоржтаун университетида машина таржимаси бўйича дунёда ўтказилган биринчи тажриба асносида йўналиш сифатида шакллана бошлади, 1960 йилга келиб мустақил фан сифатида шаклланди. Компьютер лингвистикаси инглизча «cомпутатионал лингуистиcс» сўзининг калькасидир. ХХ асрнинг 80 йилларига қадар бу фан турлича номлар билан аталган: ҳисоблаш лингвистикаси, математик лингвистика, квантитатив лингвистика, инженер лингвистикаси каби. Бу фаннинг асосий мақсади лингвистик масалаларни ечишнинг компьютер дастурларини ишлаб чиқиш, инсон ва машина (компьютер) мулоқотини оптималлаштириш , табиий тилни қайта ишлаш (Натурал Лангуаге Проcессинг)дир. НЛП компьютер лингвистикасида табиий тилларнинг компьютер анализи ва синтезини ўз ичига олади. Бунда анализ табиий тилнинг компьютерда морфологик, синтактик ва семантик таҳлил ёрдамида тушунилишига нисбатан ишлатилади, синтез эса компьютерда матннинг грамматик шакллантирилиши ва генератсияси (ҳосил қилиниши) демакдир. НЛП бўйича яратилган дастурий таъминотлар қуйидагилар: Алчемяпи, Эхперт Сйстем С.п.А., Генерал Арчитеcтуре фор Техт Энгинеэринг (ГАТЕ), Модулар Аудио Реcогнитион Фрамеwорк, Монтйлингуа, Натурал Лангуаге Тоолкит (НЛТК). Компьютер лингвистикасининг асосий вазифаларига қуйидагилар киради:
• автоматик ўқитиш тизимини ишлаб чиқиш;
• билимларни текшириш;
• матнларни турли жиҳатдан автоматик таҳрирлаш;
• матнларни автоматик тарзда морфологик, синтактик ва семантик таҳлилини (инглизча парсинг) таъминловчи тизимлар яратиш (парсер дастурлар);
• машина таржимаси учун мўлжалланган дастурларни ишлаб чиқиш;
• луғатларни ва компьютердаги матнни статистик таҳлил қилиш;
• лингвистик муаммоларни ҳал қилишга йўналтирилган оптимал дастурлар яратиш;
• мулоқотнинг компьютер моделини ишлаб чиқиш;
• матн структурасининг гипертекст технологиясини яратиш;
• электрон луғатлар ва тезауруслар яратиш;
• сунъий интеллект тизимини ишлаб чиқиш;
• матнлар корпусини яратиш;
• матнни автоматик рефератлаш;
• сюжет структурасини моделлаштириш;
• нутқни автоматик тушуниш тизимини ишлаб чиқиш (инглизча АСР – Аутоматиc Спеэч Реcогнитион); • матндан фактларни автоматик ажратиб олиш (инглизча фаcт эхтраcтион, техт мининг).
Компьютер лингвистикасида қўлланиладиган ва яратиладиган линвистик воситаларни шартли равишда иккига қисмга бўлиш мумкин: декларатив ҳамда протседура қисмлари. Декларатив қисмга тил ва нутқ бирликлари луғати, грамматик маълумотномалар, матнлар корпуси кабиларни киритиш мумкин. Протседура қисми эса юқоридаги лингвистик таъминот базасини бошқариш воситаларини (алгоритмлар тузиш, дастурлар яратиш, компьютер анализи ва синтези кабилар) ўз ичига олади.
Ўзбек тили материаллари бўйича компьютер лингвистикасига оид тадқиқот олиб борган олимлар сифатида С.Риз[аоу]ев ва С.Муҳамедов, А.Пўлатов, С.Муҳамедова, Н.Жўраеваларни алоҳида кўрсатиш мумкин. Олимлар асосан статистик таҳлил, алгоритмлаш, ўзбек тилининг аксиоматик назарияси, феълларнинг компьютер анализи ва синтези каби йўналишлар бўйича изланишларни амалга оширганлар. Ўзбек тилшунослигидаги компьютер лингвистикасининг бошқа йўналишлари эса ўз тадқиқотчиларини кутмоқда. Шунга кўра, бугунги кунда ўзбек тилшунослигининг компьютер билан боғлиқ ҳолда ҳал этилиши лозим бўлган қуйидаги вазифаларни таъкидлаб кўрсатиш мумкин:
1. Ўзбек тилининг компьютер услубини яратиш.
2. Ахборот матнларидаги қолиплилик, қисқалик стандартларини ишлаб иқиш.
3. Компьютер изоҳли ва таржима луғатларини яратиш.
4. Ўзбек тили ва адабиёти дарсликларининг электрон версияларини ишлаб чиқиш.
5. Компьютерда инглизча-ўзбекча таржима дастурларини ишлаб чиқиш.
6. Компьютердаги матнларни автоматик таҳрирлаш дастурларини яратиш.
7. Ўзбек тили грамматикасининг компьютер моделини яратиш.
8. "инглизча-ўзбекча таржимон" компьютер дастурини ишлаб чиқиш.
9. Ўзбек тилидаги матнларни таҳрир қилиш дастурларини яратиш.
10. Ўзбек тилидаги "wиндоwс" оператсион тизимини яратиш.
11. Инглизча-ўзбекча, ўзбекча-инглизча компьютер луғатларини ишлаб чиқиш.
Компьютер лингвистикаси амалий тилшуносликнинг таркибий қисми ҳисобланади, у назарий тилшунослик ютуқларидан фойдаланади, озиқланади. Компьютер лингвистикаси ва назарий тилшунослик бир-бирини тўлдиради. Компьютер лингвистикасида тил инсондан ташқарида мавҳум система сифатида, Л.Елмслев таърифи билан айтганда «соф муносабатлар тизими» сифатида тавсифланади. Компьютер лингвистикаси ва классик (мумтоз) тилшунослик орасидаги фарқ қуйидаги нуқталарда кўринади:
- Мумтоз тилшуносликда тил инсон билан мутаносибликда, жуфтликда кўриб чиқилади. Яъни мумтоз тилшунослик инсонга йўналтирилган бўлади ва унинг фаол иштирокида қабул қилинади. Компьютер лингвистикаси эса тавсифлаш жараёнида инсонни истисно қилади ва у кўпроқ компьютерга мослаштирилади.
- Мумтоз тилшунослик кўпроқ тавсифий (дескриптив) характерга эга ҳисобланади. Компьютер лингвистикаси эса масалани миқдорий характеристикалар ва аниқ параметрлар асосида ҳал қилади. Демак, мумтоз тилшунослик кўпроқ тавсифий баёнга асосланса, компьютер лингвистикаси миқдорий (квантитатив) тавсифга, алгоритмлаш, моделлаштириш, статистик таҳлилга асосланади.
- Мумтоз тилшунослик кўпроқ назарий характерга эга бўлиб, тилшуносликнинг назарий масалалари билан шуғулланади. Компьютер лингвистикаси эса амалий ҳарактерга эга бўлиб, тил билан боғлиқ муаммоларнинг амалий жиҳатларига эътибор қаратади ҳамда уни аниқ мақсадга йўналтирилган дастурлар, методлар, тизимлар ёрдамида ҳал этиш билан шуғулланади.
- Мумтоз тилшуносликнинг таҳлил объекти табиий тил ҳисобланади ва таҳлилда унинг мавжуд барча имкониятлари эътиборга олинади. Компьютер лингвистикасида эса кўпроқ сунъий тилларга (программалаштириш тиллари, алгоритмик тиллар)га таянилади, табиий тилларнинг мавжуд имкониятлари чекланади, бунда табиий тилга ишлов берилиб (НЛП), компьютерга мослаштирилади.
Фанлар ҳамиша ўзаро узвий боғлиқлик ва ҳамкорликда иш кўради, улар бир-бирисиз яшай олмайди. Жумладан, компьютер лингвистикаси фани ҳам бундан мустасно эмас. Компьютер лингвистикаси мантиқ, информатика, статистика, семиотика, кибернетика, эҳтимоллар назарияси каби турли фан соҳалари билан ўзаро алоқадорликда иш кўради.