2-MAVZU. Axborot tushunchasi va axborot nazariyasi. Zamonaviy bioinformatsion ma’lumot bazalari turlari.
Reja:
1. Nukleotidlar ketma-ketliklari bo’yicha ma’lumotlar bazalari
2. Nukleotidlar ketma – ketligini tahlilini amalga oshiruvchi dasturlar
Tayanch so’zlar: GenBank, identifikator, nukleotidlar ketma-ketligi, organizmning klassifikatsiyasi, European Molecular Biology Laboratory, tRNK, iRNK, BLAST, DNA Data Bank of Japan, NCBI
Nukleotidli ketma – ketliklar bo’yicha ma’lumotlar bazalarining mantiqiy strukturasi. EMBL MB har biri bir genom uchastkasi yoki umumiy genga tegishli alohida yozuvlardan tarkib topgan. Bu uchastka uchun nuklotidli ketma – ketliklar ularning tartibli ko’rinishi bilan birga saqlanadi. Ketma – ketlikning tasviri bu ketma – ketlikning turli xarakteristikalari keltirilgan bir necha maydonlarga bo’lingan.
EMBL MB uchun maydonlar nomlanishi va ularni tushuntirish jadvali:
ID – identifikator (noyob qisqa nomlanish)
AC – ketma –ketlikning tartib raqami
DT – kiritilgan yoki o’zgartirilgan sana
DE – ketma –ketlikning uning barcha ma’sulotlarini o’z ichiga olgan holda ta’rifi
EM – kalit so’zlar ro’yxati
OS – organizmning nomlanishi
HS – organizmning klassifikatsiyasi
OC – xo’jayin organizm nomlanishi (viruslar, faglar va boshq. uchun)
HC – xo’jayin organizm klassifikatsiyasi
RN, RA, RT, RL – ketma – ketlikning bibliografik ta’rifi
CC – sharh
FH – o’ziga xoslik jadvali sarlavhasi
FT – o’ziga xosliklar jadvali, funktsional saytlar, ketma – ketlik orqali kodlanuvchi mahsulotlar ro’yxatlari, nukleotidlarning modifikatsiyasi, mutatsiyalar ro’yxati
SQ – ketma – ketlikning statistika maydoni
Boshqa MB da ham analogik maydonlar uchraydi. GenBank MB da FT jadvallari o’rnida saytlar jadvallari va o’ziga xosliklar jadvallari qo’llaniladi. Saytlarning jadvallarida alohida saytlar yoki qismlar chegaralari ko’rsatiladi. Ularda saytlarning koordinatalari va ularning o’lchamlari keltiriladi. O’ziga xos belgilar jadvalida nukleotid ketma – ketliklaridagi keyingi qismlar belgilanadi: oqsil – kodlovchi qism, signalli peptid, yetilgan peptid, tRNK va iRNK ni kodlovchi qismlar.
MB uchun ma’lumotlar adabiyotlardan yoki bevosita mualliflardan olinadi. Mavzuga aloqador birlamchi manbaalarning (maqolalar, kitoblar, patentlar va boshqalar) o’z vaqtida kiritilishi jarayoni jiddiy qiyinchiliklarni namoyon etadi. Mavjud MB laridagi ketma – ketliklar ma’lum uzilishlar bilan kiritiladi. Birlamchi manbaalardagi ketma – ketliklar haqidagi axborotlarni tartibga solish hozirgi kunda ekspertlar orqali kiritiladi. Kim yaxshi ekspert hisoblanish bo’yicha ikki xil nuqtai nazar mavjud – chop etilgan ketma – ketlikning muallifi yoki MB ning maxsus tayyorlangan muharriri.
Axborotlarni EHM ga kiritish bosqichida birlamchi hujjatlarga EHM yordamida qisman o’zgartirish kiritish mumkin bo’lgan yangi ma’lumotlar kiritiladi (ikki marta kiritish, sintaksis nazorat va boshq).
MB da olingan ikkilamchi hujjatni yuklash paytida ushbu ma’lumotni MB sidagi oldindan mavjud ma’lumotlar bilan bog’lash muammosi kelib chiqadi. MB dagi ma’lum hajmni genom uchastkalarini sekvinirlanishi natijasida olingan ma’lumotlar egallaydi. Masalan, genomning ayni bitta uchastkasi ham genning ketma – ketligi sifatida, shu bilan bir vaqtda boshqa ma’lumotda iRNK ni kodlovchi sifatida ko’rsatilishi mumkin. Bundan tashqari, bitta yoki turli ob’ektlar ko’rinishida bo’lishi mumkin bo’lgan yaqin qrindoshli ketma – ketliklar ham bo’lishi mumkin. MB ni yaratuvchilar yuqoridagi muammolarni turli usullar bilan hal qilishadi, shuning uchun turli MB lari turlicha sifatga ega bo’ladi.
Nukleotidlarning ketma – ketliklari bo’yicha hozirgi kunda axborot hajmi jihatidan yirik ma’lumotlar bazalari quyidagilar hisoblanadi:
GenBank – genetik ketma – ketliklar ma’lumotlar bazalari hisoblanadi va NIH (Milliy Sog’liq Instituti, AQSh) tomonidan qo’llab quvvatlanadi. Bu MB sining tarkibiga DNK va RNK va oqsillarning ketma – ketliklari haqidagi axborotlar kiradi. Uning tarkibidagi ma’lumotlar har ikki oyda bir marotaba yangilanib turiladi va uchta yirik nukleotidlar ketma-ketliklari ma’lumotlar bazasini (DDBJ, EMBL, GenBank (NCBI)) birlashtiruvchi International Nucleotide Sequence Database Collaboration ning tarkibiy qismi hisoblanadi. Bu uchta tashkilot xalqaro mehnat taqsimoti bo’yicha ish olib boradi va har kunlik olingan yangi axborotlarni almashinishadi.
http://www.ncbi.nlm.nih.gov (internet manzili)
EMBL – European Molecular Biology Laboratory. Yevropa Molekulyar Biologiya Laboratoriyasining nukleotidlar ketma – ketliklari ma’lumotlar bazasi hisoblanadi. DNK yoki RNK fragmentlarining birlamchi strukturalarini aniqlashga doir ma’lumotlar bilan muntazam ravishda to’ldirilib boriladi. Bu MB ga 1982 yilda asos solingan.
http://www.ebi.ac.uk/embl/ (internet manzili)
DDBJ - DNA Data Bank of Japan. EMBL (Yevropa) va NCBI (AQSh) bilan doimiy aloqada bo’lgan DNK nukleotidlari ketma – ketliklari bo’yicha Yaponiyaning ma’lumotlar bazasi hisoblanadi. Bu ma’lumotlar bazasiga 1984 yilda Milliy genetika instituti qoshidagi informatsion biologiya markazi tomonidan asos solingan (Mishima, Japan). DDBJ MB ga axborotlar birinchi navbatda yaponiyalik olimlar tomonidan taqdim etiladi. MB da yig’ilgan umumiy axborotlarning 75 % sekvenirlangan DNK qismlari va EST (Expressed Sequence Tags) deb nomlanuvchi ekspressiyalangan genlar haqidagi ma’lumotlar hisoblanadi. http://www.ddbj.nig.ac.jp (internet manzili)
Do'stlaringiz bilan baham: |