4-MAVZU. BIOLOGIK KETMA-KETLIKLARNI TAQQOSLASH ASOSLARI.
Reja:
1. Biologik axborotlarni saqlashiga ko’ra zamonaviy banklar.
2. Odam genomi ketma ketligini aniqlash bo’yicha “Odam genomi” loyihasi haqida
Tayanch so’zlar: GenBank, identifikator, nukleotidlar ketma-ketligi, organizmning klassifikatsiyasi, European Molecular Biology Laboratory, tRNK, iRNK, BLAST, DNA Data Bank of Japan, NCBI
Zamonaviy molekulyar – genetik ma’lumotlar bazalari va ularning umumiy tuzilishi. Ma’lumotlar bazasining yaratilishi va ularning intensiv ravishda to’ldirilishi XX asrning 80-yillaridan boshlangan va juda tez sur’atlarda o’smoqda. Ma’lumotlar bazasining hajmi uch yilda mobaynida ikki marotaba ortadi. Birgina ma’lumotlar bazasini yaratuvchilar tomonidan kiritilayotgan axborotlarning tuzilmasiga va sifatiga yetarli darajada e’tibor qaratishmayapti. Genetik matnlar ma’lumotlar bazasining tuzilish printsiplari turli bahslarga olib kelmoqda. DNK ning birlamchi strukturasi va aminokislotalarning ketma – ketligi haqidagi axborotlarni saqlovchi EMBL, GenBank, DDBJ, SWISS-PROT singari yirik ma’lumotlar bazalari yangi olingan axborotlarni internet tizimida avtomatlashtirilgan to’ldiruvchi sistemalar yordamida doimo to’ldirib boriladi. Bir turdagi axborotlarni to’plovchi ko’plab ma’lumotlar bazalari xalqaro mehnat taqsimoti tizimida ishlashadi. Masalan, nukleotid ketma- ketliklari bo’yicha axborotlarni to’plovchi EMBL (Yevropa), GenBank (AQSh), DDBJ (Yaponiya) kabi ma’lumotlar bazalarining faoliyatini shunga misol qilib keltirish mumkin.
Dunyoda proteomika, oqsillar strukturasi, mutatsiyalar, transgen organizmlar, nuklein kislotalar va oqsillarning birlamchi strukturasi ma’lumotlar bazalaridan tashqari gen injenerligi uchun vektorlar, nuklein kislotalarning funktsional signallari, fermentlar, metabolik yo’llar va genetik xaritalarning ma’lumotlar bazasi hamda bu sohalardagi tadqiqotlarda zarur bo’lgan dastur ta’minotlari bo’yicha ham ma’lumotlar bazalari mavjud.
Ma’lumotlar bazasi bilan ishlash uchun EHM maxsus dasturlar kompleksi MBBT (Ma’lumotlar bazasini boshqarish tizimi) bilan ta’minlangan bo’lishi lozim va bu ma’lumotlar bazasining hujjatlari bilan turli amallarni bajarishga imkon beradi: turli parametrlar bo’yicha kerakli hujjatlarni qidirib topish, aniq belgilari bo’yicha ma’lumotlarni ajratish, ma’lumotlarni kataloglash-tirish va boshqalar.
Biologik axborotlarni saqlashiga ko’ra zamonaviy banklarni va ma’lumotlar bazalarini quyidagicha klassifikatsiyalash mumkin:
Bibliografik
DNK, RNK va oqsillarning birlamchi strukturalari bo’yicha
Molekulalarning fazoviy strukturalari bo’yicha
Genomlar bo’yicha
Boshqa tipdagi ma’lumotlar bo’yicha
Biologik ma’lumotlar bazalaridan kerakli ma’lumotlarni qidirib topish va uni olish uchun maxsus dasturiy ta’minotlar ishlab chiqarilgan. Qoidaga binoan, ma’lumotlar bazalarini yetkazib beruvchi ushbu ma’lumotlar bilan ishlashda zarur bo’lgan ko’rsatmalarni ham beradi.
WWW Entrez retrieval system internet tizimidagi ma’lumotlar banklari bilan ishlash vositasi hisoblanadi. Bu izlash tizimi National Center for Biotechnology Information (NCBI) tomonidan ishlab chiqilgan va uning tarkibiga kiritilgan ma’lumotlar bazalari
DNK ketma-ketliklari bo’yicha GenBank, EMBL, DDBJ
Oqsillar ketma-ketliklari bo’yicha SWISS-PROT, PIR, PRF, PDB
Genomlar va alohida xromosomalarni xaritalash bo’yicha ma’lumotlar
Oqsillarning uchlamchi strukturalari bo’yicha ma’lumotlarni saqlovchi (MMDB)
bilan ishlash uchun qo’llaniladi. Bibliografik ma’lumotlar bazalarida jurnallarda e’lon qilinadigan maqolalar haqidagi axborotlar saqlanadi. Bu axborotlar odatda maqolaning nomlanishi, mualliflarning ismi-familiyasi, jurnalning nomi va uning bosib chiqarilgan sanasi, kalit so’zlari hamda maqola haqidagi annotatsiyalarni o’z ichiga oladi.
Barcha bibliografik ma’lumotlar bazalari kompakt-disklarda tarqatiladi. Bulardan tashqari bu ma’lumotlar bazalarining ko’pchiligiga Internet tizimi orqali kirish imkoniyati mavjud va bu eng oxirgi axborotlarni olish imkoniyatini beradi.
Dunyodagi eng yirik bibliografik ma’lumotlar bazalaridan biri bu Chemical Abstracts hisoblanadi. Bu bazada fanning turli sohalariga oid axborotlar saqlanadi. Bu MB si orqali 190 ga yaqin maxsus ma’lumotlar bazalariga kirish imkoni mavjud, jumladan biologlar uchun foydali bo’lgan BIOSIS va MEDLINE hisoblanadi. Lekin, afsuski Chemical Abstracts bu bepul servis hisoblanmaydi va uning xizmatlari ancha qimmatligi uchun ko’pchilik tomonidan keng tarzda foydalanilmaydi.
“Ma’lumotlar bazasi” nima? Ma’lumotlar bazasi (MB) ni ma’lumotlarning tartibli ravishda biror tashuvchilarga yozilgan ko’rinishda tasvirlash mumkin. Ma’lumot – bu son, mantiqiy konstanta (“ha” yoki “yo’q” tipidagi), yoki ayni MB da ahamiyatga ega matnning biror fragmenti bo’lishi mumkin. Real MB larida tartiblanganlik predmet qismiga bog’liq ravishda turlicha bo’lishi mumkin.
Yuqorida keltirilganlardan katta hajmdagi yozilgan bilimlar majmuasi tushadi. Masalan, har qanday kitobning matni MB ga misol bo’lishi mumkin, bu matn aniq bir ko’rinishda tartiblangan bo’ladi. MB nima uchun ishlatiladi? Oddiy javob – ma’lumotni berish uchun. Ixtiyoriy matnda kerakli ma’lumotning hatto u matn tarkibida ochiq ko’rinishda namoyon bo’lib turgan bo’lsada uni ajratib olish qiyinligi ma’lum.
Tartiblanganlikning yuqori darajasini entsiklopediyalar, ma’lumotnomalardagi (spravochnik) moddama-modda matnlar ko’rsatadi. Ko’pincha MB sifatida har biri real dunyoning alohida ob’ektiga tegishli ma’lumotlar tartibi sifatida qaraladi. Ba’zida undagi ma’lumotlarni birlamchi hujjatlardan farqli ravishda ikkilamchi hujjat sifatida qaraladi. Ob’ektning turli tomonlari xotiraning maydon deb ataluvchi turli bo’limlarida yoziladi.
Yozuvlar MB ning ma’lumotlari uchun qulay uning identifikatori bilan solishtiriladi. MB ning ob’ektlari ularni u yoki bu usulda sinflarga ajratish mumkin bo’lgan turli belgilarga ega bo’lishi mumkin. Kalit (kalit so’z) sifatida (odatda oldindan kiritilgan) ob’ekt sinflarga mos keluvchi so’z tanlanadi. Ma’lumotlarni MB da kalit yoki kalit so’zlar kombinatsiyasi yordamida izlab topish mumkin.
Bilimlarni yig’ish jarayonida (tekshiruvchini birinchi navbatda qiziqtiradigan) ikki muammo yuzaga kelishi mumkin: ma’lumotlarni tartiblashtirish va ularni ma’lum formatga keltirish. Informatikada ma’lumotlarni yig’ishning odatiy yo’li – faktografik MB ni tuzishdir.
Molekulyar-genetik MB ning ob’ektlari sifatida nukleotidli, aminokislotali ketma – ketliklar, genetik xaritalar, fermentlar, nukleotid zondlar va boshqalar hisoblanadi. Hozirgi kunda asosiy molekulyar – genetik MB sifatida quyidagilar (Bilofsky et al..1986, Hann, Cameron, 1986: George et al..1986) hisoblanadi:
EMBL, Nucleotide Sequence Data Library (hajmi 30 mln nukleotiddan ortiq, 1989);
GenBank Genetic Sequence Data Bank (hajmi 30 mln nukleotiddan oshiq, 1989);
NBRF – PIR Protein Sequence Data Bank (2 mln aminokislotalari qoldiqlari atrofida, 1989).
Ma’lumotlarni tartibli ko’rinishda tasvirlash masalasining murakkabligi (molekulyar genetika va molekulyar biologiya nazarda tutilmoqda) ma’lumotlarni ilmiy tildagi ta’riflanishida va aynan shu til orqali ma’lumotlarning to’planishidir.
Markaziy tushuncha sifatida yagona ajratilgan funktsiyaga ega genom uchastkasi ketma – ketligi hisoblanadi. U bilan quyidagi tushunchalar bog’liq: organizm – turli darajalardagi biologik tur yoki taksonomik guruh; kategoriya – kalit so’z (ular uchun tarmoqli model qo’llaniladi); tip – keyingi to’qqiz tipdan biri: birlamchi transkript, yetilgan mRNK, oqsil – kodlovchi uchastka, intron, rRNK, tRNK, mRNK, noyob tipsiz ketma – ketlik, barcha boshqa holatlar: muallif – ayni ketma – ketlik haqidagi nashrlar muallifi. Bu tushunchalar ularga sharhlar bilan bog’langan bo’lishi mumkin. Ketma – ketlik, organizm, kategoriya, tip, muallif tushunchalari qidiruvga oid tushunchalar hisoblanadi.
Do'stlaringiz bilan baham: |