O’ZBEKISTON RESPUBLIKASI OLIY VA O’RTA MAXSUS TA’LIM VAZIRLIGI MIRZO ULUG’BEK NOMIDAGI O’ZBEKISTON MILLIY UNIVERSITETI BIOLOGIYA FAKULTETI, BIOLOGIYA YO’NALISHI 405-GURUH TALABASI SHUKURBEKOV BOBURNING BIOINFORMATIKA FANIDAN
KURS ISHI
Mavzu: UniProt ma’lumotlar bazasi va uning ahamiyati
Topshirdi: Shukurbekov B
Qabul qildi: PhD Ro’ziboyev X.S
TOSHKENT-2022
MUNDARIJA
I.Kirish………………………………………………………………………….
|
3
|
II.Asosiy qism………………………………………………………………….
|
7
|
2.1.UniProt ma’lumotlar bazasi……………………………………………….
|
7
|
2.2. Biologik ma’lumotlar bazalari…………………………………………….
|
12
|
2.3. Ma’lumotlar bazalari yaratish……………………………………………...
|
29
|
III.Xulosa……………………………………………………………………….
|
33
|
IV.Foydalanilgan adabiyotlar ro’yxati…………………………………………
|
36
|
Kirish
Hozirgi kunda inson faoliyatida ma’lumotlar bazasi (MB) kerakli axborotlarni saqlash va undan oqilona foydalanishda juda muhim rol o‘ynamoqda. Sababi: jamiyat taraqqiyotining qaysi jabhasiga nazar solmaylik o‘zimizga kerakli ma’lumotlarni olish uchun, albatta, MBga murojaat qilishga majbur bo‘lamiz. Demak, MBni tashkil qilish axborot almashuv texnologiyasining eng dolzarb hal qilinadigan muammolaridan biriga aylanib borayotgani davr taqozosidir.
Informatsion texnologiyalarning rivojlanishi va axborot oqimlarining tobora ortib borishi, ma’lumotlarning tez o‘zgarishi kabi holatlar insoniyatni bu ma’lumotlarni o‘z vaqtida qayta ishlash choralarining yangi usullarini qidirib topishga undamoqda. Ma’lumotlarni saqlash, uzatish va qayta ishlash uchun MBni yaratish, so‘ngra undan keng foydalanish bugungi kunda dolzarb bo‘lib qolmokda. Moliya, ishlab chiqarish, savdo-sotiq va boshqa korxonalar ishlarini ma’lumotlar bazasisiz tasavvur qilib bo‘lmaydi.
Ma’lumki, MB tushunchasi fanga kirib kelgunga qadar, ma’lumotlardan turli ko‘rinishda foydalanish juda qiyin edi. Dastur tuzuvchilar ma’lumotlarini shunday tashkil qilar edilarki, u faqat qaralayotgan masala uchungina o‘rinli bo‘lardi. Har bir yangi masalani hal qilishda ma’lumotlar qaytadan tashkil qilinar va bu hol yaratilgan dasturlardan foydalanishni qiyinlashtirar edi.
Har qanday axborot tizimining maqsadi real muhit ob’ektlari haqidagi ma’lumotlarga ishlov berishdan iborat. Keng ma’noda ma’lumotlar bazasi - bu qandaydir bir predmet sohasidagi real muhitning aniq ob’ektlari haqidagi ma’lumotlar to‘plamidir. Predmet sohasi deganda avtomatlashtirilgan boshqarishni tashkil qilish uchun o‘rganilayotgan real muhitning ma’lum bir qismi tushiniladi. Masalan, korxona, zavod, ilmiy tekshirish instituti, oliy o‘quv yurti va boshqalar. Shuni qayd qilish lozimki, MBni yaratishda ikkita muhim shartni hisobga olmoq zarur:
Birinchidan, ma’lumotlar turi, ko‘rinishi, ularni qo‘llaydigan programmalarga bog‘liq bo‘lmasligi lozim, ya’ni MBga yangi ma’lumotlarni kiritganda yoki ma’lumotlar turini o‘zgartirganda, programmalarni o‘zgartirish talab etilmasligi lozim.
Ikkinchidan, MBdagi kerakli ma’lumotni bilish yoki izlash uchun biror programma tuzishga hojat qolmasin. Shuning uchun ham MBni tashkil etishda ma’lum qonun va qoidalarga amal qilish lozim. Bundan buyon axborot so‘zini ma’lumot so‘zidan farqlaymiz, ya’ni axborot so‘zini umumiy tushuncha sifatida qabul qilib, ma’lumot deganda aniq bir belgilangan narsa yoki hodisa sifatlarini nazarda tutamiz.
Ma’lumotlar bazasini yaratishda, foydalanuvchi axborotlarni turli belgilar bo‘yicha tartiblashga va ixtiyoriy belgilar birikmasi bilan tanlanmani tez olishga intiladi. Buni faqat ma’lumotlar tizilmalashtirilgan holda bajarish mumkin.
Tizimlashtirish – bu ma’lumotlarni tasvirlash usullari haqidagi kelishuvni kiritishdir. Agar ma’lumotlarni tasvirlash usuli haqida kelishuv bo‘lmasa, u holda ular tizilmalashtirilmagan deyiladi. Tizilmalashtirilmagan ma’lumotlarga misol sifatida matn fayliga yozilgan ma’lumotlarni ko‘rsatish mumkin. Ma’lumotlar bazasidan foydalanuvchilar turli amaliy dasturlar, dasturiy vositalari, predmet sohasidagi mutaxassislar bo‘lishi mumkin.
Ma’lumotlar bazasining zamonaviy texnologiyasida ma’lumotlar bazasini yaratish, uni dolzarb holatda yuritishni va foydalanuvchilarga undan axborot olishini ta’minlovchi maxsus dasturiy vosita, ya’ni ma’lumotlar bazasini boshqarish tizimi yordami bilan markazlashtirilgan holda amalga oshirishni nazarda tutadi.
Ma’lumotlar bazasi – EHM xotirasiga yozilgan ma’lum bir strukturaga ega, o‘zaro bog‘langan va tartiblangan ma’lumotlar majmuasi bo‘lib, u biror bir ob’ektning xususiyatini, holatini yoki ob’ektlar o‘rtasidagi munosabatni ma’lum ma’noda ifodalaydi. MB foydalanuvchiga strukturalashtirilgan ma’lumotlarni saqlash va ishlatishda optimal qulaylikni yaratib beradi.
Ma’lumki ma’lumotlarni kiritish va ularni qayta ishlash jarayoni katta hajmdagi ish bo‘lib ko‘p mehnat va vaqt talab qiladi. MB bilan ishlashda undagi ma’lumotlarning aniq bir strukturagi ega bo‘lishi, birinchidan foydalanuvchiga ma’lumotlarni kiritish va qayta ishlash jarayonida undagi ma’lumotlarni tartiblashtirish, ikkinchidan kerakli ma’lumotlarni izlash va tez ajratib olish kabi qulayliklarni tug‘diradi. MB tushunchasi fanga kirib kelgunga qadar, ma’lumotlardan turli ko‘rinishlarda foydalanish juda qiyin edi. Bugungi kunda turli ko‘rinishdagi ma’lumotlardan zamonaviy kompьyuterlarda birgalikda foydalanish va ularni qayta ishlash masalasi hal qilindi. Kompьyuterlarda saqlanadigan MB maxsus formatga ega bo‘lgan muayyan tuzilmali fayl bo‘lib, undagi ma’lumotlar o‘zaro bog‘langan va tartiblangandir.
Demak, ma’lumotlar bazasi deganda ma’lum bir strukturada saqlanadigan ma’lumotlar to‘plami tushuniladi. Boshqacha qilib aytganda MB - bu ma’lum berilgan aniq bir strukturaga ega bo‘lgan ma’lumotlarni o‘z ichiga oluvchi maxsus formatga ega bo‘lgan fayldir. Ma’lumotlarni strukturalashtirish - bu shunchaki ma’lumotlarni tasvirlashda qandaydir moslikni kiritish usulidir. Odatda MB ma’lum bir ob’ekt sohasini ifodalaydi va uning ma’lumotlarni o‘z ichiga oladi, ularni saqlaydi va foydalanuvchiga ma’lumotlarni qayta ishlashda undan foydalanish imkonini yaratib beradi.
Ma’lumotlar bazasi - axborot tmzimlarining eng asosiy tarkibiy qismi bo‘lib hisoblanadi. Ma’lumotlar bazasidan foydalanish uchun foydalanuvchi ishini engillashtirish maqsadida ma’lumotlar bazasini boshqarish trizimlari yaratilgan. Bu tizimlar ma’lumotlar bazasini amaliy dasturlardan ajratadi. Ma’lumotlar bazasini boshqarish tizimi (MBBT) -bu dasturiy va apparat vositalarining murakkab majmuasi bo‘lib, ular yordamida foydalanuvchi ma’lumotlar bazasini yaratish va shu bazadagi ma’lumotlar ustida ish yuritishi mumkin.
Juda ko‘p turdagi MBBT mavjud. Ular o‘z maxsus dasturlash tillariga ham ega bo‘lib, bu tillarga SUBD buyruqli dasturlash tillari deyiladi. MBBTga Oracle, Clipper, Paradox, FoxPro, Access va boshqalarni misol keltirish mumkin.
Ma‘lumotlar bazasini boshqarish tizimi – bu ma’lumotlar bazasini yaratish, ularni dolzarb holatini ta’minlash va undagi zarur axborotni topish ishlarini tashkil etish uchun mo‘ljallangan dasturlar majmui va til vositasidir. Ma’lumotlar bazasi tushunchasi maydon, yozuv, fayl (jadval) kabi elementlar bilan chambarchas bog‘liq . Maydon-bu ma’lumotlarni mantiqiy tashkil etishni elementar birligi bo‘lib, u axborotni eng kichik va bo‘linmas birligi bo‘lgan rekvizitga mos keladi. Maydonni tasvirlash uchun quyidagi tavsiflardan foydalaniladi: Maydon nomi, masalan, familiyasi, ismi, tug‘ilgan sana, lavozimi, ish staji, mutaxassisligi.
Maydon turi, masalan, son (chislovoy), simvol (simvolьnыy), sana/vaqt (data/vremya), mantiqiy (logicheskiy). Maydon uzunligi (o‘lchami), masalan, eng ko‘p simvollar sig‘imi; Maydon aniqligi, (son tipidagi ma’lumotlar uchun) masalan, sonning o‘nlik ksr qismini aks ettirish uchun o‘nlik raqamdan to‘rtta. Yozuv –bu mantiqiy bog‘langan maydonlar to‘plami. YOzuv tuzilishi uchun uning tarkibiga kiruvchi maydolar tarkibi va joylashishi ketma-ketligi bilan aniqlanib, ularni har biri ichida elementar yozuvlarning nusxasi deb ataladi. Yozuv ob’ektning biror bir elementi haqida to‘liq ma’lumotni ifodalaydi.
Fayl (jadval) -bu bir xil tuzilmaga ega bo‘lgan yozuvning nusxalar to‘plamidir. U o‘zicha har bir maydonda qiymatga ega. Misol . STUDENT faylidagi (jadvalidagi) yozuvlarning mantiqiy strukturasini tavsiflashga doir misolda ko‘rsatilgan. STUDENT faylidagi yozuvning tuzilishi chiziqli bo‘lib, u o‘zgarmas uzunlikdagi yozuvlardan iborat. Yozuv maydonlari takrorlanuvchi qiymatlar guruhiga ega emas. Maydon qiymatiga murojaat uning nomeri bo‘yicha amalga oshiriladi.
Har bir MB jadvali o‘zining birlamchi kalitiga ega bo‘lishi mumkin. Birlamchi kalit deganda ezuvlar kaytarilmasligini ta’minlovchi maydon (polya) yoki maydonlar guruxi tushiniladi. Birlamchi kalit sifatida ishlatiladigan maydon eki maydonlar guruxi, bir xil yozuvga ega bo‘lmaslik shartini bajarishi kerak. Boshqa maydonlarida bir xil yozuvlar takrorlanishi mumkin. Shu sabab ular
1-rasm. STUDENT faylidagi yozuvlar mantiqiy tuzilishining tavsifi
birlamchi kalit bo‘laolmaydi. Birlamchi kalit qisqa va sonli maydonlardan tashkil topishi maqsadga muvofiqdir. MB jadvaliga birlamchi kalitni kiritishdan maqsad, jadvaldagi ma’lumotlarni izlash, tartiblashtirish va tanlab olishda qulaylikni beradi. Birlamchi kalit kiritish yoki kiritmaslik foydalanuvchi tamonidan MB jadvali strukturasini tashkil qilishda aniqlanadi.
Bosh jadval yordamida qaram jadvaldagi mos ma’lumotlarni chaqirishni ta’minlash uchun qaram jadvalda tashqi kalit tashkil qilinadi. “Bitta-ko‘pga” bog‘lanish holatida tashqi kalit bosh jadvalda tashkil qilinadi. Birinchi va ikkinchi kalitlarni aniqlashda MBBT avtomatik ravishda jadvalda indekslarni quradi.
UniProt ma’lumotlar bazasi
Universal Protein Resurs (UniProt) oqsil ketma-ketligi va izoh ma'lumotlari uchun keng qamrovli manbadir. UniProt ma'lumotlar bazalari: UniProt ma'lumotlar bazasi (UniProtKB) , UniProt ma'lumot klasterlari ( UniRef) va UniProt arxivi (UniParc). UniProt konsorsiumi va mezbon institutlar EMBL-EBI, SIB va PIR UniProt ma'lumotlar bazalarini uzoq muddatli saqlashga sodiqdir.
UniProt Yevropa bioinformatika instituti (EMBL-EBI) , SIB Shveytsariya bioinformatika instituti va oqsil axborot resursi (PIR) o'rtasidagi hamkorlikdir . Uchta institut bo'ylab 100 dan ortiq odam ma'lumotlar bazasini qayta ishlash, dasturiy ta'minotni ishlab chiqish va qo'llab-quvvatlash kabi turli vazifalar orqali jalb qilingan.
EMBL-EBI va SIB birgalikda Swiss-Prot va TrEMBL ishlab chiqarish uchun ishlatilgan, PIR esa Proteinlar ketma-ketligi ma'lumotlar bazasini (PIR-PSD) ishlab chiqargan. Ushbu ikkita ma'lumotlar to'plami turli xil proteinlar ketma-ketligi qamrovi va izoh ustuvorliklari bilan birga mavjud edi. TrEMBL (Translated EMBL Nukleotid Sequence Data Library) dastlab ketma-ketlik ma'lumotlari Swiss-Protning ushlab turish qobiliyatidan yuqori tezlikda yaratilganligi sababli yaratilgan. Shu bilan birga, PIR PIR-PSD va tegishli ma'lumotlar bazalarini, shu jumladan iProClass, oqsil ketma-ketliklari ma'lumotlar bazasi va kuratorli oilalarni saqladi. 2002 yilda uchta institut o'z resurslari va tajribalarini birlashtirishga qaror qildi va UniProt konsorsiumini tuzdi.
UniProt konsortsiumi Aleks Beytman , Alan Bridge va Keti Vu tomonidan boshqariladi, asosiy xodimlar tomonidan qo'llab-quvvatlanadi va mustaqil ilmiy maslahat kengashidan qimmatli ma'lumotlarni oladi .
UniProt Milliy Ko'z Instituti (NEI) , Milliy Inson Genomi Tadqiqot Instituti (NHGRI) , Milliy Yurak, O'pka va Qon Instituti (NHLBI) , Qarish Milliy Instituti (NIA) , Milliy Allergiya va Yuqumli Kasalliklar Instituti (NIAID ) tomonidan qo'llab-quvvatlanadi. ) , Qandli diabet va ovqat hazm qilish va buyrak kasalliklari milliy instituti (NIDDK) , Milliy umumiy tibbiyot fanlari instituti (NIGMS) , Milliy ruhiy salomatlik instituti (NIMH) va Milliy sog'liqni saqlash institutlarining (NIH) Milliy saraton instituti (NCI )U24HG007822 granti bo'yicha.
EMBL-EBI ning UniProt-dagi ishtiroki uchun qo'shimcha yordam Evropa molekulyar biologiya laboratoriyasi (EMBL) asosiy fondlari, Buyuk Britaniyaning Altsgeymer tadqiqotlari (ARUK) granti ARUK-NAS2017A-1, Biotexnologiya va biologik fanlar tadqiqot kengashi (BBSRC) [BB/T010541] tomonidan taqdim etiladi. /1] va Maqsadlarni ochish . SIBdagi UniProt faoliyati qo'shimcha ravishda Shveytsariya federal hukumati tomonidan Ta'lim, tadqiqot va innovatsiyalar bo'yicha SERI davlat kotibiyati orqali qo'llab-quvvatlanadi . PIR ning UniProt faoliyati, shuningdek, NIH grantlari R01GM080646, G08LM010720 va P20GM103446 va Milliy Fan Jamg'armasi (NSF) DBI-1062520 grantlari tomonidan qo'llab-quvvatlanadi.
UniProt ma'lumotlar bazalari uchta ma'lumotlar bazasi qatlamidan iborat:
(i) UniProt arxivi (UniParc) umumiy foydalanish mumkin bo'lgan oqsil ketma-ketligi ma'lumotlarining to'liq jamini saqlash orqali barqaror, keng qamrovli, ortiqcha bo'lmagan ketma-ketlik to'plamini taqdim etadi.
(ii) UniProt ma'lumotlar bazasi (UniProt) oqsil ketma-ketligining markaziy ma'lumotlar bazasini aniq, izchil va boy ketma-ketlik va funktsional izoh bilan ta'minlaydi.
(iii) UniProt NREF ma'lumotlar bazalari (UniRef) bir nechta ruxsatlarda ketma-ketlik maydonini to'liq qamrab olish uchun UniProt ma'lumotlar bazasiga asoslangan ortiqcha bo'lmagan ma'lumotlar to'plamini taqdim etadi.
UniProt arxivi (UniParc) mavjud bo'lgan eng keng qamrovli, ortiqcha bo'lmagan oqsillar ketma-ketligi to'plamidir. U Swiss-Prot, TrEMBL, PIR-PSD, EMBL ( 3 ), Ensembl ( 4 ), IPI ( http://www.ebi.ac.uk/IPI ), PDB kabi ko'plab turli manbalardan ommaviy foydalanish mumkin bo'lgan oqsil ketma-ketliklarini o'z ichiga oladi. ( 5 ), RefSeq ( 6 ), FlyBase ( 7 ), WormBase ( 8 )), Yevropa, Amerika va Yaponiya patent idoralari. Protein ketma-ketligi bir nechta ma'lumotlar bazalarida va ma'lum bir ma'lumotlar bazasida bir necha marta mavjud bo'lishi mumkin bo'lsa-da, UniParc har bir noyob ketma-ketlikni faqat bir marta saqlaydi va noyob UniParc identifikatorini tayinlaydi.
Bundan tashqari, UniParc manba ma'lumotlar bazalariga (kirish raqamlari), ketma-ketlik versiyalari va holatiga (faol yoki eskirgan) o'zaro havolalar beradi. UniParc ketma-ketligi versiyasi ham taqdim etiladi va har safar asosiy ketma-ketlik o'zgarganda oshiriladi, bu esa barcha manba ma'lumotlar bazalarida ketma-ketlik o'zgarishlarini kuzatish imkonini beradi. UniParc hisobotining namunasini http://srs.ebi.ac.uk/srsbin/cgi-bin/wgetz?-noSession+-e+[UNIPARC:UPI0000133132] (SRS ko'rinishi) va http://www.pir saytlarida topish mumkin. uniprot.org/cgi-bin/upEntry?id=UPI0000133132 (PIR ko'rinishi).
UniProt ma'lumotlar bazasi konsorsium faoliyatining markaziy qismidir. Biz Swiss-Prot, TrEMBL va PIR-PSD ni izohlar va funktsional ma'lumotlar bilan oqsil ketma-ketligining markaziy ma'lumotlar bazasini ta'minlash uchun UniProt ma'lumotlar bazasini yaratish uchun birlashtirdik. Swiss-Prot + TrEMBL-da etishmayotgan barcha mos PIR-PSD ketma-ketliklari UniProt-ga kiritilgan. PIR-PSD yozuvlarini oson kuzatish uchun Swiss-Prot + TrEMBL va PIR-PSD o'rtasidagi ikki tomonlama o'zaro mos yozuvlar yaratilgan. PIR-da mavjud boʻlgan, lekin Swiss-Prot + TrEMBL da etishmayotgan maʼlumotnomalar va eksperimental tasdiqlangan maʼlumotlarni UniProtʼga oʻtkazish davom etmoqda.
UniProt ma'lumotlar bazasi ikki qismdan iborat: adabiyot ma'lumotlarini olish va kurator tomonidan baholangan hisoblash tahlili natijasida to'liq qo'lda izohlangan yozuvlarni o'z ichiga olgan bo'lim va to'liq qo'lda izohni kutayotgan hisoblash tahlil qilingan yozuvlarga ega bo'lim. Davomiylik va nom tanib olish uchun ikkita bo'lim "Swiss-Prot" va "TrEMBL" deb nomlanadi. Misol UniProt hisobotini http://www.expasy.org/cgi-bin/niceprot.pl saytida topish mumkin? P57727 (NiceProt ko'rinishi), http://www.pir.uniprot.org/cgi-bin/upEntry?id= P57727 (iProClass ko'rinishi) yoki http://srs.ebi.ac.uk/cgi-bin/wgetz? -e+[swall-acc: P57727 ] (SRS ko'rinishi).
UniProt ma'lumotlar bazasi ikki qismdan iborat: adabiyot ma'lumotlarini olish va kurator tomonidan baholangan hisoblash tahlili natijasida to'liq qo'lda izohlangan yozuvlarni o'z ichiga olgan bo'lim va to'liq qo'lda izohni kutayotgan hisoblash tahlil qilingan yozuvlarga ega bo'lim. Davomiylik va nom tanib olish uchun ikkita bo'lim "Swiss-Prot" va "TrEMBL" deb nomlanadi. Misol UniProt hisobotini http://www.expasy.org/cgi-bin/niceprot.pl saytida topish mumkin? P57727 (NiceProt ko'rinishi), http://www.pir.uniprot.org/cgi-bin/upEntry?id= P57727 (iProClass ko'rinishi) yoki http://srs.ebi.ac.uk/cgi-bin/wgetz? -e+[swall-acc: P57727 ] (SRS ko'rinishi).
Uniprot dastlab protein ketma-ketligi va eksperimental dalillarga asoslangan funktsional izohlar uchun asosiy ma'lumotlar bazasi sifatida tuzilgan. Hozirgi vaqtda u oqsil ketma-ketligi uchun ishlab chiqarilgan barcha darajadagi izohlarni markazlashtiruvchi qardosh ma'lumotlar bazalari tarmog'ini birlashtiradi. Shuningdek, u minglab genom loyihalarining uzluksiz bajarilishi natijasida olingan kontseptual tarjimalarni o'z ichiga oladi. UniProt muntazam ravishda yangilanadi va har bir necha haftada yangi nashrni taqdim etadi.
UniProt bosh sahifasi SwissProt va TrEMBL ichidagi barcha izohli ketma-ketliklarga kirish imkonini beradi . Ushbu ikkita ma'lumotlar bazasi mos ravishda qo'lda tanlangan va avtomatik izohlangan protein yozuvlarini saqlaydi.
Qo'shimcha ma'lumotlar har bir kirish maydonchasi yonida joylashgan va u yuqori chiziq (i) bilan ko'rsatilgan.
Agar siz UniProt ma'lumotlar bazasi haqida ko'proq bilmoqchi bo'lsangiz, UniProt konsorsiumi nashrini o'qishingiz mumkin
UniProt ma'lumotlar bazasi (UniProtKB) oqsillar to'g'risidagi funktsional ma'lumotlarni to'plash uchun markaziy markaz bo'lib, aniq, izchil va boy izohga ega. Har bir UniProtKB yozuvi uchun majburiy bo'lgan asosiy ma'lumotlarni (asosan, aminokislotalar ketma-ketligi, oqsil nomi yoki tavsifi, taksonomik
2-rasm. UniProt ma’lumotlar bazasi
ma'lumotlar va iqtibos ma'lumotlari) olishdan tashqari, iloji boricha ko'proq izoh ma'lumotlari qo'shiladi. Bunga keng tan olingan biologik ontologiyalar, tasniflar va o'zaro havolalar, eksperimental va hisoblash ma'lumotlarining dalil atributi ko'rinishidagi annotatsiya sifatining aniq ko'rsatkichlari kiradi.
UniProt ma'lumotlar bazasi ikkita bo'limdan iborat: adabiyotlardan olingan ma'lumotlar va kurator tomonidan baholangan hisoblash tahlili bilan qo'lda izohlangan yozuvlarni o'z ichiga olgan bo'lim va to'liq qo'lda izohni kutayotgan hisoblash tahlil qilingan yozuvlar bo'limi. Davomiylik va nomni aniqlash maqsadida ikkita bo'lim mos ravishda "UniProtKB/Swiss-Prot" (ko'rib chiqilgan, qo'lda izohlangan) va "UniProtKB/TrEMBL" (ko'rib chiqilmagan, avtomatik izohlangan) deb nomlanadi.
Nima uchun UniProtKB 2 bo'limdan iborat, UniProtKB/Swiss-Prot va UniProtB/TrEMBL?
Protein ketma-ketligi qayerdan keladi?
UniProtKB tomonidan taqdim etilgan oqsil ketma-ketliklarining 95% dan ortig'i ommaviy nuklein kislotalar ma'lumotlar bazalariga, EMBL-Bank/GenBank/DDBJ ma'lumotlar bazalariga ( INSDC ) taqdim etilgan kodlash ketma-ketliklari (CDS) tarjimasidan olingan. Ushbu ketma-ketliklarning barchasi, shuningdek, mualliflar tomonidan taqdim etilgan tegishli ma'lumotlar avtomatik ravishda UniProtKB/TrEMBL bilan birlashtiriladi.
UniProtKB oqsil ketma-ketligi qayerdan keladi?
UniProtKB barcha protein ketma-ketligini o'z ichiga oladimi?
UniProtKB/Swiss-Prot va UniProtKB/TrEMBL o'rtasidagi farqlar qanday?
UniProtKB/TrEMBL (ko'rib chiqilmagan) hisoblangan izoh va keng ko'lamli funktsional xarakteristikalar bilan bog'liq protein ketma-ketligini o'z ichiga oladi. UniProtKB/Swiss-Prot (ko'rib chiqilgan) yuqori sifatli qo'lda izohlangan va ortiqcha bo'lmagan oqsillar ketma-ketligi ma'lumotlar bazasi bo'lib, u tajriba natijalari, hisoblangan xususiyatlar va ilmiy xulosalarni birlashtiradi.
Universal Protein Resurs (UniProt) ilmiy hamjamiyatni oqsil ketma-ketligi va funktsional ma'lumotlar uchun yagona, markazlashtirilgan, vakolatli resurs bilan ta'minlaydi. Swiss-Prot, TrEMBL va PIR protein ma'lumotlar bazasi faoliyatini birlashtirish orqali tashkil etilgan UniProt konsortsiumi oqsil ketma-ketligi ma'lumotlar bazalarining uchta qatlamini ishlab chiqaradi: UniProt Arxivi (UniParc), UniProt ma'lumotlar bazasi (UniProt) va UniProt Reference (UniRef) ma'lumotlar bazalari. UniProt ma'lumotlar bazasi keng qamrovli, to'liq tasniflangan, boy va to'g'ri izohlangan proteinlar ketma-ketligi bo'yicha keng ko'lamli o'zaro havolalarga ega ma'lumotlar bazasidir. Ushbu markaziy qism ikki qismdan iborat: UniProt/Swiss-Prot, to'liq, qo'lda tanlangan yozuvlar bilan; va UniProt/TrEMBL, avtomatlashtirilgan tasnif va izohlar bilan boyitilgan. 2004 yil davomida o'n minglab ma'lumotlar bazasi yozuvlari qo'lda izohlangan yoki yangilangan; biz yangi sharhlar qatori mavzusini kiritdik: toksinning o'tkir toksikligi to'g'risidagi ma'lumotlarni saqlash uchun TAXIC DOZA; UniProt kalit so'zlar ro'yxati qo'shimcha kalit so'zlar bilan to'ldirildi; biz kalit so'zlarning hujjatlarini takomillashtirdik va translatsiyadan keyingi o'zgartirishlar annotatsiyasini doimiy ravishda qayta ko'rib chiqamiz va standartlashtiramiz.
Bundan tashqari, biz shtammlar va ularning sinonimlarining yangi hujjat faylini taqdim etdik. Ko'plab yangi ma'lumotlar bazasi o'zaro bog'liqliklari joriy etildi va biz Raqamli ob'ekt identifikatorlaridan foydalanishni boshladik. Shuningdek, biz EBIdagi Makromolekulyar tuzilma maʼlumotlar bazasi guruhi bilan hamkorlikda Protein maʼlumotlar banki yozuvlaridagi ketma-ketliklarni tegishli UniProt yozuvlariga qoldiq darajasini xaritalash orqali tizimli maʼlumotlar bazalari bilan yaxshilangan integratsiyaga erishdik.
Qulay ketma-ketliklarni qidirish uchun biz UniRef ortiqcha bo'lmagan ketma-ketlik ma'lumotlar bazalarini taqdim etamiz. Keng qamrovli UniParc ma'lumotlar bazasi ommaviy mavjud bo'lgan protein ketma-ketligi ma'lumotlarining to'liq qismini saqlaydi. UniProt ma'lumotlar bazalariga onlayn kirish mumkin (http://www.uniprot.org ) yoki bir nechta formatlarda yuklab olingan ( ftp://ftp.uniprot.org/pub ). Yangi nashrlar har ikki haftada chop etiladi.
Biologik ma’lumotlar bazalari
Biologik ma‘lumotlar bazasi - bu tizimda saqlanadigan ma‘lumotlarning tarkibiy qismlarini yangilash, so‘rash va yuklab olish uchun mo‘ljallangan, kompyuterlashtirilgan dasturiy ta‘minot bilan bog‘langan jarayon hisoblanadi. Oddiy ma‘lumotlar bazasi har xil ma‘lumot to‘plamini o‘z ichiga olgan bitta fayl bo‘lishi mumkin.
Ma‘lumotlar bazasini rivojlantirishning asosiy maqsadi ma‘lumotlarni oson qidirib topishga imkon beradigan tuzimli to‘plamida ma‘lumotlarni tashkil qilishdir. Misol uchun bir nechta mashhur ma‘lumotlar bazalari: NCBI - Genotika Milliy Biotexnologiya Markazi, Shveytsariya Bioinformatika Institutidan-SwissProt va Protein Axborot Resursidan-PIR ma‘lumotlar bazalarini keltirish mumkin. Biologik ma’lumotlar bazalarining turlari. Ularning tarkibiga qarab biologik ma‘lumotlar bazalarini taxminan ikki toifaga bo‘lish mumkin:
1. Birlamchi ma‘lumotlar bazalari: Birlamchi ma‘lumotlar bazalari arxivlashgan ma‘lumotlar bazasi deb ham ataladi. Ular nukleotidlar ketmaketligi, oqsillar ketma-ketligi yoki makromolekulyar tuzilish kabi eksperimental ravishda olingan ma‘lumotlar kabilar bilan to‘ldirilgan. Eksperimental tadqiqot natijalari tadqiqotchilar tomonidan to‘g‘ridan-to‘g‘ri ma‘lumotlar bazasiga topshiriladi va bu ma‘lumotlar arxivlanib boradi. Ma‘lumotlar quyidagi bazalarga taqdim etiladi:
o EMBL, GenBank NCBI va DDBJ-nukleotidlar ketma-ketligi,
o Array Express Archive va GEO-funktsional genomik ma‘lumotlar,
Protein ma‘lumotlari banki -PDB uch o‘lchovli makromolekulyar tuzilmalar koordinatalari.
2. Ikkilamchi ma‘lumotlar bazalari: Ikkilamchi ma‘lumotlar bazalari dastlabki ma‘lumotlarni tahlil qilish natijasida olingan ma‘lumotlarni o‘z ichiga oladi. Ikkilamchi ma‘lumotlar bazalari ko‘pincha ko‘plab manbalardan olingan ma‘lumotlarga, shu jumladan boshqa ma‘lumotlar bazalariga boshlang‘ich va ikkinchi darajali ma‘lumotlar bazalariga asoslanadi.
Do'stlaringiz bilan baham: |