O`zbekiston Respublikasi Axborot texnologiyalari Vazirligi Muhammad al - Xorazmiy nomidagi Toshkent Axborot Texnologiyalari Universiteti
Tarmoqni Dasturlash asoslari fanidan
1-Mustaqil ishi
Mavzu: JSoup
Guruh: 417-18
Bajardi: Abdurashidov D.
Tekshirdi: Abdullayev U.
Toshkent – 2021
1
Mundarija
Reja………………………………………………… 3
Kirish………………………………………………. 4
Jsoup haqida……………………………………….. 5
Jsoup kutubxonasi…………………………………. 6
jsoup Java HTML Parser 1.14.3 API…………….. 7
jsoup Java HTML Parser 1.14.3 API…………….. 10
Foydalanilgan adabiyotlar ………………………… 13
2
Reja:
Kirish
Jsoup kutubxonasi
jsoup Java HTML Parser 1.14.3 API
3
Kirish
jsoup - bu haqiqiy HTML bilan ishlash uchun Java kutubxonasi. U eng yaxshi HTML5 DOM usullari va CSS selektorlaridan foydalangan holda URL-manzillarni olish va ma'lumotlarni olish va boshqarish uchun juda qulay API taqdim etadi.
jsoup WHATWG HTML spetsifikatsiyasini amalga oshiradi va HTMLni zamonaviy brauzerlar kabi bir xil DOM ga ajratadi.
URL, fayl yoki satrdan HTMLni tahlil qilish
DOM traversal yoki CSS selektorlari yordamida ma'lumotlarni toping va chiqarib oling
HTML elementlari, atributlari va matnini boshqarish
XSS oldini olish uchun foydalanuvchi tomonidan taqdim etilgan kontentni xavfsiz ro'yxatga qarshi tozalang
tartibli HTML chiqaring
jsoup yovvoyi tabiatda topilgan barcha HTML navlari bilan ishlash uchun mo'ljallangan; toza va validating dan, yaroqsiz teg-sho'rva; jsoup oqilona tahlil daraxtini yaratadi.
kutubxona 1.13.1 versiyasiga o'sdi, hajmi biroz kichikroq bo'ldi va ishlash tezroq bo'ldi (deyarli ikki marta). Yomon yangilik shundaki, mening internet bilan bog'liq misollarim Android 4.0 da ishlashni to'xtatdi, chunki ular endi asosiy tarmoqda tarmoq operatsiyalaridan foydalanishga aniq ruxsat bermadi.
Maqolaning eski versiyasini shu yerda qoldiraman. Agar siz eski qurilmalar uchun dasturlar yozsangiz, unda hamma narsa o'zgarishsiz qoladi. Yangi qurilmalar uchun misollar 4-kursning yopiq zonasida joylashgan.
umumiy ma'lumot
Keling, jsoup kutubxonasi bilan ishlash misollarini ko'rib chiqaylik. Jsoup Java kutubxonasi HTML sahifalarini tahlil qilish uchun mo'ljallangan bo'lib, DOM,
4
CSS va jQuery uslubidagi usullardan foydalanib kerakli ma'lumotlarni olish imkonini beradi.
Kutubxona HTML5 spetsifikatsiyalarini qo'llab-quvvatlaydi va zamonaviy brauzerlar kabi sahifalarni tahlil qilish imkonini beradi.
Kutubxonani URL, fayl yoki qatorni tahlil qilish uchun siljitish mumkin.
Kutubxonaning rasmiy sahifasi: jsoup Java HTML Parser, eng yaxshi DOM, CSS va jQuery bilan
Biz kutubxonani bog'laymiz
Android Studio'da build.gradle faylingizga qaramlik blokiga qator qo'shing.
Amalga oshirish "org.jsoup: jsoup: 1.13.1"
Yangi JsoupDemo loyihasini yarating. Shaklga tugma va TextView qo'shing.
Kutubxonani o'rnatganingizdan so'ng, matnni tahlil qilish uchun hujjat olishingiz kerak. Bu saytdagi sahifa yoki qurilmadagi mahalliy fayl bo'lishi mumkin. Shunday qilib, siz kerakli sahifaga ulanishingiz va Document sinfining ob'ektini olishingiz kerak. Import qilishda org.jsoup.nodes.Document sinfining toʻliq nomiga eʼtibor bering, chunki koʻpgina paketlar tarkibida bir xil nomdagi sinf mavjud.
Hujjat hujjati = Jsoup.connect (URL) .get ();
Hujjatni o'zingizning ixtiyoringizda olganingizdan so'ng, siz kerakli ma'lumotlarni olishingiz mumkin. Masalan, siz barcha meta teglarni olishingiz mumkin:
Elementlar metaElements = doc.select ("meta");
Select () usuli sizga kerakli teglarni olish imkonini beradi.
5
Agar teg atributini olishingiz kerak bo'lsa, attr () usulidan foydalaning:
String nomi = metaElement.attr (“nom”);
Siz berilgan sinf bilan teglarni tanlashingiz mumkin. Masalan, sahifada
Do'stlaringiz bilan baham: |