Muhammad al-Xorazmiy nomidagi Toshkent Axborot Texnologiyalari Universiteti
TELEKOMMUNIKATSIYA TEXNOLOGIYALARI fakulteti
AXBOROT UZATISH TIZIMLARI kafedrasi
Axborotlarni izlash va ajratib olish fanidan
Oraliq nazorat ishi
BAJARDI: “AUT” 401- 21 Aziza Yuldasheva
TOSHKENT-2022
Axborotlarni izlash va ajratib olish fanidan
Oraliq nazorat savollari
1
|
10 ta va undan ortiq so’zdan iborat, o’zingiz haqingizda 10 ta gap berilgan. Shu gapni ID hujjatini yarating va BOOL (AND, OR, NOT) operatsiyasi yordamida natijani aniqlang.
|
2
|
Kompyuter xotirasida 30 ta katalog bor. Uning ichida 35 ta fayl bor. Fayllarning ma’lumotlarini VECTOR FAZO MODELI asosida matritsa hosil qilish (Ustun yoki satr shaklida).
|
3
|
100 gb hajmdagi word dokumentlar bor. Ularni fleshkaga shunday tezlikda o’tkazish kerakki, o’tkazishga sarflanadigan vaqt kam bo’lishi kerak.
|
1. Aziza Yuldasheva
Men, Yuldasheva Aziza Zakirovna, hozirda Axborot texnologiyalari universtitetining “Telekommunikatsiya texnologiyalari” fakulteti magistratura bosqichining birinchi bosqich talabasiman. O’zim haqimda qisqacha ma’lumot beradigan bo’lsam, 2005 – yili Uchtepa tumanidagi 193 – maktabni tamomladim. So’ngra, 1 – Toshkent Pedagogika kollejiga o’qishga qabul qilindim va shu bilan birga oxirgi bosqichda ish faoliyatimni ham boshladim. Dastlab, “UzDJTU” da laborant, haftaning bir kunida esa maktabda boshlang’ich sinflarga ingliz tilidan dars ham o’tishni boshladim. Afsuski, kollejni tamomlagach oliy o’quv yurtida talaba bo’lish nasib etmadi, ammo o’qituvchi sifatida ish faoliyatimni maktabda davom ettirdim. Maktabda kadrlar yetishmaganidanmi, bilmadim, meni ingliz tili o’qituvchilikka vaqtincha kadr sifatida ishga qabul qilishdi. Oliy ma’lumotga ega bo’lmasamda, maktabda, bir necha o’quv markazlarda hamda uyda ingliz tili o’qituvchi sifatida ishlab ko’plab shogirdlar chiqardim. O’qishga bo’lgan qiziqishim tufayli va nihoyat oradan 7 yil o’tgach, 2014 – yili men Toshkent shahridagi Inha universtitetiga o’qishga qabul qilindim. O’qish davomida ko’plab qiyinchiliklarga duch keldim, ammo yaqinlarimning qo’llab – quvvatlashlari tufayli barini yengib o’tdim. Hozirda Adliya vazirligi qoshidagi “Davlat xizmatlari agentligi”da ish faoliyatimni olib bormoqdaman, shu bilan birga magistratura bosqichida ham tahsil olmoqdaman.
Dastlab matnni qaysi tildaligi aniqlanadi.
Matnni normallashtiramiz, buning uchun lemmalash kabi matnni normallashtirish turlaridan foydalanamiz. (lemmalash – bitta so’zning har xil shakllarini boshlang’ich kononik shaklga keltirish)
Matnni so’zlarga ajratamiz, ya’ni tokenlash amalga oshiriladi.
So’zlarni atamalarga aylantiramiz va to’xtash so’zlarini olib tashlaymiz.
Sof so’zlardan tashkil topgan lug’atni hosil qilamiz.
Xujjatlarni “doc ID” si yaratiladi (qayerda joylashgani)
-
№
|
So’zlar
|
Frequency (so’z necha marta ishtirok ertgani)
|
txt
|
doc
|
pdf
|
Mp3
|
|
Aziza
|
1
|
22
|
22
|
22
|
22
|
|
Yuldasheva
|
1
|
30
|
30
|
30
|
30
|
|
Zakirovna
|
1
|
55
|
55
|
55
|
55
|
|
men
|
5
|
4
|
4
|
4
|
4
|
|
axborot
|
4
|
14
|
14
|
14
|
14
|
|
texnologiya
|
3
|
89
|
89
|
89
|
89
|
|
universtitet
|
3
|
56
|
56
|
56
|
56
|
|
Telekommunikatsiya
|
3
|
24
|
24
|
24
|
24
|
|
fakultet
|
2
|
32
|
32
|
32
|
32
|
|
magistratura
|
3
|
25
|
25
|
25
|
25
|
|
bosqich
|
2
|
78
|
78
|
78
|
78
|
|
Birinchi
|
3
|
96
|
96
|
96
|
96
|
|
Ma’lumot
|
5
|
65
|
65
|
65
|
65
|
|
Tuman
|
1
|
45
|
45
|
45
|
45
|
|
Maktab
|
2
|
85
|
85
|
85
|
85
|
|
ish
|
3
|
16
|
16
|
16
|
16
|
|
faoliyat
|
4
|
1
|
1
|
1
|
1
|
|
hafta
|
1
|
11
|
11
|
11
|
11
|
|
laborant
|
1
|
55
|
55
|
55
|
55
|
|
kun
|
1
|
68
|
68
|
68
|
68
|
|
Boshlang’ich
|
2
|
87
|
87
|
87
|
87
|
|
sinf
|
1
|
13
|
13
|
13
|
13
|
|
Oliy
|
2
|
31
|
31
|
31
|
31
|
|
Qiyinchilik
|
1
|
64
|
64
|
64
|
64
|
|
vazirlik
|
1
|
46
|
46
|
46
|
46
|
|
Markaz
|
1
|
98
|
98
|
98
|
98
|
|
O’qituvchi
|
3
|
88
|
88
|
88
|
88
|
|
Talaba
|
3
|
7
|
7
|
7
|
7
|
|
Ko’p
|
2
|
79
|
79
|
79
|
79
|
|
Kadr….
|
1
|
97
|
97
|
97
|
97
|
Ushu Python dasturida yozilgan algoritm orqali matnni so’zlarga ajratish mumkin:
d = {}
with open("dict.txt") as f:
for line in f:
(key, val) = line.split()
d[int(key)] = val
print (d)
Xujjatni qidirishda aniqroq natijaga erishish uchun Bool operatsiyalaridan foydalanib qidiruv so’rovini shakllantirishiz mumkin:
Aziza AND Yuldasheva AND Zakirovna
(texnologiya OR Inha) AND universtiteti
“Telekommunikatsiya texnologiyalari” AND “UzDJTU”
2. Vektorli fazo modeli yoki vektorli model atamasi matnli hujjatlarni (va umuman olganda har qanday ob'ektlarni) identifikatorlar vektorlari (masalan, indeks terminlari) sifatida ko'rsatish uchun algebraik modeldir. U ma'lumotni filtrlash, ma'lumotlarni qidirish, indekslash va dolzarblik reytingida qo'llaniladi.
Hujjatlar va so’rovlar vector fazo modelida quyidagicha ifodalanadi:
Atama
|
Doc 1
|
Doc 2
|
Doc …
|
Doc 35
|
So’z 1
|
1
|
0
|
…
|
1
|
So’z 2
|
0
|
1
|
…
|
0
|
…
|
…
|
…
|
…
|
1
|
So’z N
|
0
|
1
|
…
|
1
|
3. Fayllarni kompyuterdan fleshkaga qanday tez o'tkazish mumkin?
1-usul: USB drayverlarini yangilash. 1) Windows 10 da Win + X tugmalarini bosing va Boshlash menyusidan Device Managerni tanlang.
2) Disk drayverlari bo'limini kengaytiring, USB drayverni o'ng tugmasini bosing va "Drayverni yangilash" ni tanlang. (usb drayverini yangilash)
3) Yangilangan drayverni qidirish avtomatik ravishda amalga oshiriladi.
2-usul: USB drayveringizni sozlash. 1) Qurilma menejeri interfeysida Disk drayverlarini kengaytirgandan so'ng USB drayverni toping va “Xususiyatlar”ni tanlash uchun uni o'ng tugmasini bosing. 2) “Siyosat” yorlig'iga o'ting, “Ishlashni yaxshilash”ni tanlang va qurilmada yozish keshini yoqing.
3-usul: Fayl tizimini o'zgartirish. Fayl tizimi USB drayverning ishlashiga ta'sir qilishi mumkin. Odatda, USB FAT32 fayl tizimi bilan birga keladi. Lekin vaziyatga qarab uni NTFS yoki exFAT formatida formatlashingiz mumkin. Umuman olganda, NTFS Windows 10/8/7 da fayllarni uzatish uchun tezroq va samaraliroq, exFAT esa Mac uchun yaxshiroqdir. USB orqali ma'lumotlarni uzatishni tezlashtirish uchun siz tegishli fayl tizimidan foydalanishingiz kerak. Agar siz Windows kompyuteridan foydalansangiz, FAT32-ni NTFS-ga o'zgartirishingiz mumkin. Buning uchun siz CMD, Disk Management yoki professional bo'lim menejeri - MiniTool Partition Wizard-dan foydalanishingiz mumkin.
4-usul: USB 3.0 ga yangilash. Agar USB flesh-diskingiz 2.0 interfeysidan foydalansa, USB uzatish tezligi sekinlashishi muammosiga duch kelishingiz mumkin. USB ma'lumotlar uzatishni tezlashtirish uchun siz USB 3.0 ga yangilashingiz mumkin, chunki bu interfeys USB 2.0 dan 10 baravar tezroq. Windows 10/8/7 ga ma'lumotlarni uzatish uchun USB 3.0 drayveridan foydalaning.
5-usul: USB flesh-diskini orqa portga ulash (faqat desktop kompyuterlar uchun).
Ish stoli kompyuterida bir nechta portlar mavjud, jumladan old va orqa. Odatda, ish stoli kompyuter fleshka o'rtasida fayllarni uzatishda siz USB drayverini bitta old portga ulaysiz. USB ma'lumotlarni uzatishni tezlashtirish uchun siz flesh-diskni bitta orqa portga ulashingiz mumkin, chunki u Intel chipsetida ishlaydi, bu esa oldingi portga qaraganda tezroq tezlikni ta'minlaydi. Bundan tashqari, orqa port yanada barqaror quvvat manbaiga ega.
6 – usul: Yana bir usuli ma’lumotlarni siqish va undan so’ng fleshkaga o’tkazish. Sababi ma’lumotlar Zip yoki rar faylga o’tkazilganda uning hajmi kichrayadi, natijada ma’lumotlarni fleshkaga o’tkazish vaqti kamayadi.
7 – usul: Men ma’lumotlarni fleshkaga ko’chirayotganimda tezlik pasaysa F5 tugmasidan foydalanib fayllarni ko’chirish tezligini oshiraman. Yoki ma’lumotlarni ma’lum bir qismlarga ajratib fleshkaga ko’chiraman.
8 – usul: USB flesh-diskida bo'sh joy mavjudligi ma'lumotlarni uzatish tezligiga eng muhim ta'sir ko'rsatadi. Bundan tashqari, ma'lumotlarni uzatish tezligi fayl hajmi va fayl joylashuviga ham ta'sir qiladi. Shuning uchun, USB flesh-disklarida fayl uzatish tezligini oshirish uchun yetarli bo'sh joy bo'lishi tavsiya etiladi.
Do'stlaringiz bilan baham: |