● Naqsh
Veb (ma'lumotlar) qazib olish / skanerlash va umumiy NLP vazifalari.
Pattern, birinchi navbatda, Python uchun veb-mining moduli bo'lib, unda ma'lumotlarni qazib olish, tabiiy tilni qayta ishlash, mashinalarni o'rganish va tarmoq tahlili kabi ko'plab maqsadlar uchun vositalar mavjud.Patternning NLP jihatiga e'tibor qaratib, u har qanday NLP ning muhim xususiyatlari bilan yaxshi jihozlangan, masalan, nutq qismlari, n-grammalar, hissiyotlarni tahlil qilish, WordNet, matn tasnifi va tokenizatsiya.
U darhol boshlash uchun 350 dan ortiq birlik testlari va 50 dan ortiq misollar bilan to'liq hujjatlashtirilgan . Veb-API-larni qo'llab-quvvatlash Pattern funksiyalarini kengaytirish uchun boshqa dasturlash tillari bilan oson integratsiyalashish imkonini beradi.
Google Trend - Vaqt o'tishi bilan naqsh qiziqishi
NLTK — eng ko'p tilga olingan NLP kutubxonasi
NLTK — eng ko'p tilga olingan NLP kutubxonasi
Google Trends — Shakl ( manba )
● Poliglot
Ko'p tillilik va transliteratsiya imkoniyatlari.
Rami Al-Rfou tomonidan ishlab chiqilgan Polyglot - bu Pythonning tabiiy tillarini qayta ishlash kutubxonasi bo'lib, u keng tillar to'plami bilan shug'ullanishi kerak bo'lgan ilovalar uchun juda mos keladi.
Tokenizatsiya, tilni aniqlash, nutqning bir qismini belgilash va qolganlari kabi bir nechta tabiiy tilni qayta ishlash xususiyatlarini qo'llab-quvvatlagan holda, uning har bir NLP xususiyati bir nechta tillarni qo'llab-quvvatlash orqali yanada kuchaytiriladi.
Bir nechta tillarni qo'llab-quvvatlash uni mahalliylashtirish hal qiluvchi rol o'ynaydigan hayotiy variantga aylantiradi. U batafsil hujjatlar bilan birga keladi, bu har bir kishi uchun kirish jarayonini soddalashtiradi.
● TextBlob
NLTK - Nomlangan ob'ektlarni aniqlash ( manba )
Textblob ( manba )
Textblob matnga asoslangan ma'lumotlarni qayta ishlash uchun boshqa ochiq manba Python kutubxonasi bo'lib, API orqali boshqa dasturlash tillari bilan silliq integratsiyani taklif etadi. Agar siz standart NLP operatsiyalarini bajarishga shoshilayotgan bo'lsangiz, Textblob sizning qutqaruvchingiz bo'lishi mumkin. U har qanday tabiiy tilni qayta ishlash kutubxonasi uchun standart bo'lgan bir nechta xususiyatlarni taqdim etadi, masalan:
● Nutq qismini teglash
● His-tuyg‘ularni tahlil qilish
● Tasniflash
● Tokenizatsiya
● n-gramm
● So‘zning o‘zgarishi
● WordNet integratsiyasi
● Tilni tarjima qilish va aniqlash Google Translate tomonidan quvvatlanadi
● So'z va iboralar chastotalari
● Tahlil qilish
● Imlo tuzatish
● Kengaytmalar orqali yangi modellar yoki tillarni qo'shing
U yangi o'quvchilar uchun o'rganish egri chizig'ini nisbatan yumshoqroq qilish uchun keng qamrovli qo'llanmalar bilan birga keladi.
Do'stlaringiz bilan baham: |