Zamonaviy bioinformatsion ma’lumot bazalari haqidagi ma’lumotlar bilan tanishish. Biblografik ma’lumot bazalari. Matnli ma’lumotlarni olish instrumentlari. Kerakli jihozlar
Zamonaviy bioinformatsion ma’lumot bazalari haqidagi ma’lumotlar bilan tanishish. Biblografik ma’lumot bazalari. Matnli ma’lumotlarni olish instrumentlari. Kerakli jihozlar: internetga ulangan kompyuter, prezentatsiya, tarqatma material
Ma'lumotlar bazasini tasniflash Bir nechta ma'lumotlar bazasi tasnifi mavjud. Zamonaviy banklar va biologiya ma'lumotlar bazalarini quyidagi ma'lumotlarga ko'ra tasniflash mumkin: • bibliografik; • Birlamchi DNK, RNK, oqsillar ketma-ketligi; Molekulalarning fazoviy tuzilishi. • Genomik; • Boshqa tematik. Dunyoda dastlabki to'rt turdagi ma'lumotlar banklarini qo'llab-quvvatlaydigan bir nechta yirik markazlar mavjud va ma'lum mavzular bo'yicha ma'lumotlar bazalarini o'z ichiga olgan ko'plab tashkilotlar mavjud (masalan, ribosomal genlar bo'yicha ma'lumotlar bazasi yoki fermentlarni tasniflash, p53 gen mutatsiyalari yoki Saccharomyces cerevisiae oqsillari va boshqalar.). Ma'lumotlarning tashkil etilishiga qarab ma'lumotlar bazalari arxiv, derivativ va tuzatilgan ma'lumotlar bazalariga bo'linadi. Arxiv ma'lumotlari bazasi: • GenBank va EMBL - barcha shifrlangan genomlarning asosiy ketma-ketliklari bu erda saqlanadi • PDB - oqsillarning fazoviy tuzilishi. Nazorat ostidagi ma'lumotlar bazalari: • Swiss-Prot - oqsillarning aminokislotalar ketma-ketligini o'z ichiga olgan eng yuqori sifatli ma'lumotlar bazasi; • KEGG - metabolizm haqida ma'lumot; • FlyBase - Drosophila haqida ma'lumot; COG - har birining nomiga qarama-qarshi bo'lgan alifbo ro'yxatidagi ortologik genlar to'g'risidagi ma'lumotlar. NCBI Genom ma'lumotlar bazasidagi tirik organizmlarning genomlari ro'yxati Tuzilgan ma'lumotlar bazalari
Bunday ma'lumotlar bazalari arxivlangan va tuzatilgan ma'lumotlar bazasidan ma'lumotlarni qayta ishlash natijasida olingan: • SCOP - Oqsillarning tarkibiy tasnifi ma'lumotlar bazasi (oqsil tarkibi tavsiflangan); • PFAM - oqsil oilalari to'g'risidagi ma'lumotlar bazasi; • GO (Gen Ontologiyasi) - Genlarni tasniflash (bitta genga boshqacha nom berilmasligi va turli xil genlarga bir xil nom berilmasligi uchun atamalar to'plamini tuzish, terminologiyani tashkil qilish); • ProDom - oqsil domenlari. 6 1.2 Genomlar va kasalliklar to'g'risidagi ma'lumotlarni o'z ichiga olgan ma'lumotlar bazalarining qiyosiy tavsiflari Biotibbiy ma'lumotlar bazasining maqbul tuzilishi bir nechta funktsional talablarga javob berishi kerak: - ma'lumotlar bazasi hajmi deyarli cheklanmagan bo'lishi kerak (ya'ni, faqat apparat parametrlari bilan cheklangan). Bugungi kunda adabiyotlarda e'lon qilingan ma'lumotlarning ahamiyatsiz qismi ma'lumotlarni rasmiylashtirish bilan bog'liq qiyinchiliklar tufayli ma'lumotlar bazalariga kiritilgan.
Zamonaviy ma'lumotlar bazalari jadval ma'lumotlari bilan ishlashga moslashtirilgan relyatsion ma'lumotlar bazalari asosida yaratiladi, shuning uchun oson rasmiylashtiriladigan ma'lumotlar (jadval ko'rinishida taqdim etiladi) ma'lumotlar bazasiga kiritiladi. Murakkab biologik tizimlar to'g'risida ma'lumotni to'liq rasmiylashtirish deyarli mumkin emas; - Ma'lumotlar bazasi to'liq qayta tuzilishga imkon beradigan darajada moslashuvchan bo'lishi kerak, chunki dinamik ravishda to'ldiriladigan ma'lumotlar bazasining batafsil tuzilishini oldindan tuzish mumkin emas. Ushbu talab molekulyar biologiya sohasidagi bilimlarning dinamik ravishda rivojlanib borayotganligidan kelib chiqadi va uni kompyuterda ishlash uchun qulay bo'lgan har qanday oldindan ishlab chiqilgan qattiq tizimda tasvirlash juda qiyin: - chunki maxsus xalqaro ma'lumotlar bazalarida turli xil xalqaro ma'lumotlar bazalarida taqdim etilgan ma'lumotlar ma'lumotlar bazasiga birlashtirilishi kerak. formatlar, ma'lumotlar bazasi nafaqat standart multimedia formatlarini, balki bir qator maxsus formatlarni (fazoviy molekulyar tuzilmalar, kimyoviy struktura) qo'llab-quvvatlaydigan gipermedia muhitida yaratilishi kerak. e formula boshqalar) .; - ma'lumotlar bazasini ishlashi va to'ldirishi kompyuter tarmoqlari orqali o'qimagan foydalanuvchilarga (biologlar, shifokorlar) kompyuter tarmoqlari orqali osonlikcha kirishi kerak. 7 Ushbu xususiyatlardan foydalangan holda biz ba'zi bir ma'lumotlar bazalarini taqqoslaymiz: HEFalMP (http://sonorus.princeton.edu/hefalmp) "+" a) qidiruvlarning bir nechta turlari (garchi bu ko'pgina ma'lumotlar bazalari uchun odatiy bo'lsa); b) genlarning grafik funktsional aloqalarini quradi; c) qidiruv parametrlarini o'rnatishning qulay va oson usuli; "-" bu natijalarni chiqarish uchun noqulay format. GAD (Genetik assotsiatsiya ma'lumotlar bazasi) (http://geneticassociationdb.nih.gov) "+" a) so'rov bo'yicha batafsil ma'lumotni ko'rsatish (ba'zan hatto ortiqcha); b) boshqa ma'lumotlar bazalariga qaraganda (20 kasallik kasalliklari) juda katta ro'yxatdagi kasalliklar sinfini tanlash imkoniyati; v) namunaning hajmi va kelib chiqishi hisobga olingan holda; d) natija = matnli tavsif + faol havolalarga ega jadval; e) atrof-muhit omillarining ta'sirini hisobga olish (boshqa hech qanday ma'lumotlar bazasida mavjud emas); "-" oddiy qidiruvda faqat bitta "kalit so'zlar" so'rov formati mavjud (ma'lumotlar bazasidan foydalanuvchi shifokorlar uchun bu "+" bo'lishi mumkin).