Ma'lumotlar yig'ish:
Yangilik maqolalari va u haqida ma'lumot to'plash va maqolalar matnini tozalash (HTML teglari, URL manzili) Ma'lumotlar to'plamini saqlash
Ma'lumotlarni yuklash:
D ← {0yangilik maqola 10,...,0 yangiliklar maqola N0} L ← {0yorliq 10,...,0 yorliq N0}, bu yerda |D| = |L| = N S ← {0toʻxtash soʻzi 10,...,0 toʻxtash soʻzi M0}, bu yerda |S| = M Matnni oldindan qayta ishlash:
har bir di ∈ D uchun di dan barcha tinish belgilarini (0.0, 0!0, 0;0 , ..., 0?0) va raqamlarni ([0...9]) olib tashlang Har bir sj ∈ S do uchun di dan barcha harflarni kichik harflarga aylantirish sj to'xtash so'zini di end fordan olib tashlang .
Do'stlaringiz bilan baham: |