Raqamli texnalogiyalar fakulteti dasturiy injenerig kafedrasi


Natural Lanbuage Toolkit (NLTK)



Download 0,72 Mb.
bet2/11
Sana01.03.2022
Hajmi0,72 Mb.
#476903
1   2   3   4   5   6   7   8   9   10   11
Bog'liq
Tabiiy tilni qayta ishlashni boshlash

Natural Lanbuage Toolkit (NLTK)


NLTK - bu inson tilidagi ma'lumotlar bilan ishlash uchun Python loyihalarini yaratish uchun asosiy kutubxona. U WordNet kabi 50 dan ortiq korpus va leksik aktivlarga foydalanish uchun oddiy interfeyslarni, shuningdek, NLP kutubxonalari uchun teglash, tahlil qilish, tasniflash, stemming, tokenizatsiya va semantik mulohazalar uchun matnni qayta ishlash kutubxonalarini o'rnatish va faol suhbat muhokamasini taqdim etadi. NLTK Windows, Mac OS va Linux uchun mavjud. Eng yaxshi tomoni shundaki, NLTK bepul, ochiq manbali, mahalliy hududga asoslangan korxona. Buning ham kamchiliklari bor. Ishlab chiqarishdan foydalanish talablariga javob berish sekin va qiyin. O'rganish chizig'i qandaydir tarzda tik. NLTK tomonidan taqdim etilgan ba'zi xususiyatlar;

  • Ob'ektni chiqarish

  • Nutqning bir qismini teglash

  • Tokenizatsiya

  • Tahlil qilish

  • Semantik fikrlash

  • To'planish

  • Matn tasnifi


Qo'shimcha ma'lumot olish uchun rasmiy hujjatlarni tekshiring: Havola

GenSim


Gensim - bu tabiiy tillarni qayta ishlash vazifalari uchun mashhur python kutubxonasi. U vektor fazosini modellashtirish va mavzuni modellashtirish asboblar to'plamidan foydalangan holda ikkita hujjat o'rtasidagi semantik o'xshashlikni aniqlash uchun maxsus xususiyatni taqdim etadi. GenSim-dagi barcha algoritmlar korpus hajmiga bog'liq holda xotiraga bog'liq emas, bu biz RAMdan kattaroq ma'lumotlarni qayta ishlashimiz mumkinligini anglatadi. U ierarxik dirixlet jarayoni (HDP), tasodifiy proyeksiyalar (RP), latent dirixlet taqsimoti (LDA), yashirin semantik tahlil (LSA/SVD/LSI) yoki word2vec chuqur o'rganish kabi tabiiy til vazifalarida juda foydali bo'lgan algoritmlar to'plamini taqdim etadi. . GenSim-ning eng ilg'or xususiyati uning qayta ishlash tezligi va xotiradan foydalanishni ajoyib optimallashtirishdir. GenSim-ning asosiy qo'llanilishi ma'lumotlarni tahlil qilish, matn yaratish ilovalari (chatbotlar) va semantik qidiruv ilovalarini o'z ichiga oladi.

Tabiiy tilni qayta ishlash (NLP) - bu ma'lumotlar fani va sun'iy intellekt (AI) chorrahasida joylashgan soha bo'lib, u asoslarga qadar qaynatilganda - bu mashinalarga inson tillarini tushunish va matndan ma'no chiqarishni o'rgatishdir. Shuning uchun ham mashinani o'rganish ko'pincha NLP loyihalarining bir qismidir.


Ammo nega ko'plab tashkilotlar bugungi kunda NLPga qiziqish bildirmoqda. Birinchi navbatda, bu texnologiyalar ularga iste'molchilarning mahsulot bilan o'zaro aloqada bo'lishi mumkin bo'lgan til bilan bog'liq muammolarini hal qiluvchi keng qamrovli qimmatli tushunchalar va echimlarni taqdim etishi mumkinligi sababli.
Google, Amazon yoki Facebook kabi texnologiya gigantlari o'zlarining chatbotlari, virtual yordamchilari, tavsiya dvigatellari va mashinani o'rganish orqali boshqariladigan boshqa yechimlarni quvvatlantirish uchun ushbu tadqiqot yo'nalishiga millionlab dollar sarflashlarining sababi bor.
NLP ilg'or hisoblash ko'nikmalariga tayanganligi sababli, ishlab chiquvchilar NLP yondashuvlari va tabiiy tillarni boshqarishi mumkin bo'lgan xizmatlarni yaratish algoritmlaridan maksimal darajada foydalanishga yordam beradigan eng yaxshi vositalarga muhtoj.

Download 0,72 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   11




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish