1-rasm. DDBJ/GENBANK/GenBank xalqaro ma'lumotlar bazalari o'rtasida ma'lumotlar oqimi.
GENBANK Release 48 dan olingan eng yaxshi beshta organizm:
Xususan, EST ma'lumotlari (ifodalangan ketma-ketlik teglari) katta hajmda ishlab chiqariladi va ma'lumotlar bazasiga kiritiladi. Butun genomni yoki uning bir qismini ketma-ketlashtirish o'rniga, g'oya turli organizmlarning alohida hujayralari, organlari yoki to'qimalarida ifodalangan genlarni ifodalovchi DNKning qisqa bo'laklarini ketma-ketlashtirishdan iborat bo'lib, gen ekspresyon naqshlarining "dinamik" rasmini beradi. GENBANK Release 48-dagi EST yozuvlarining umumiy soni 606 286 tani tashkil etadi va davom etayotgan sa'y-harakatlar tufayli bu raqam eksponent ravishda oshib boradi. GENBANK nukleotidlar ketma-ketligi ma'lumotlar bazasi ko'p miqdorda yangi ketma-ketlik ma'lumotlarini ishlab chiqaradigan ko'payib borayotgan genomlar ketma-ketligi guruhlari bilan doimiy hamkorlikka ega.
2-rasm. GENBANK nukleotidlar ketma-ketligi ma'lumotlar bazasi o'sishi.
Alohida olimlar tomonidan to'g'ridan-to'g'ri ma'lumotlarni taqdim etish turli xil elektron mexanizmlar, masalan, EBI WWW Submission Tool tomonidan osonlashtiriladi, bu nashrdan oldin ma'lumotlar bazasiga ketma-ketlik ma'lumotlarini va tavsiflovchi biologik ma'lumotlarni elektron shaklda taqdim etish imkonini beradi. Ko'pgina jurnallar jurnal maqolalarida paydo bo'ladigan ketma-ketlik ma'lumotlari nashrdan oldin Xalqaro nukleotidlar ketma-ketligi ma'lumotlar bazalariga taqdim etilishini kutishadi. Majburiy taqdim etish siyosati, ma'lumotlar bazasiga kirish raqamlarini maqolalarda muntazam chop etish, shuningdek, ayrim yirik jurnallar tomonidan "Mundarija" ro'yxatlarini erta tarqatish yangi ketma-ketlik ma'lumotlarining o'z vaqtida mavjudligi va tarqalishini ta'minlaydi.
GENBANK nukleotidlar ketma-ketligi ma'lumotlar bazasi allaqachon mavjud ma'lumotlar bazasi yozuvlarida bibliografik ma'lumotnomalarni yangilash kontekstida Evropaning barcha yirik molekulyar biologiya jurnallarini skanerlashni davom ettirmoqda. Evropa Patent idorasi (EPO) bilan davom etayotgan hamkorlik natijasida 25 000 dan ortiq nukleotidlar va oqsillar ketma-ketligi qo'lga kiritildi, ular 1960 va 1993 yillar oralig'ida patent hujjatlarida nashr etilgan (Patent Backfile) va ilgari elektron shaklda ochiq bo'lmagan. EPO va EBI o'rtasidagi hamkorlik kontekstida 1994 yildan beri elektron shaklda EPOda olingan patent ma'lumotlarini integratsiyalash uchun yangi yo'nalish mavjud (Patent Front fayli).
Kelajakdagi ba'zi yirik ishlanmalar genom loyihalaridan kelib chiqadigan o'sib borayotgan ma'lumotlar miqdorini qayta ishlash va tartibga solish mexanizmlarini yaratish, juda uzun ketma-ketliklarni (masalan, to'liq xromosomalar) qayta ishlash protseduralarini, shuningdek, virtual ketma-ketlik yozuvlarini ko'rsatishni o'z ichiga oladi.
To'liq GENBANK nukleotidlar ketma-ketligi ma'lumotlar bazasi har chorakda ixcham disklar to'plamida tarqatiladi. CD-ROMda ma'lumotlarni so'rash va olish uchun dasturiy ta'minot ham taqdim etilgan. Barcha yangi va yangilangan yozuvlarning kundalik qoʻshimchalarini oʻz ichiga olgan maʼlumotlar bazasi EBI tarmogʻi xizmatlari (pastga qarang) va Yevropa molekulyar biologiya tarmogʻi (EMBnet, pastga qarang) tugunlaridan foydalanish mumkin. GENBANK nukleotidlar ketma-ketligi ma'lumotlar bazasi yozuvlari taksonomiya asosida bo'limlarga guruhlangan. Ma'lumotlar bazasi yozuvlari GENBANK tekis fayl formatida tarqatiladi, bu ko'pgina ketma-ketlikni tahlil qilish dasturiy paketlari tomonidan qo'llab-quvvatlanadi. Yassi fayl yozuvining har bir satri satrdagi ma'lumotlar turini ko'rsatadigan ikki belgidan iborat satr kodidan boshlanadi. Foydalanuvchi uchun qoʻllanma hujjati tegishli satr kodlari va tavsiflarga muvofiq toʻliq maʼlumotni taqdim etuvchi EBI WWW sahifalarida mavjud. Ma'lumotlar bazasining odatiy yozuvi ketma-ketlikni, kataloglash maqsadlari uchun qisqacha tavsifni, manba organizmning taksonomik tavsifini, ma'lumotnoma ma'lumotlarini va kodlash hududlari va boshqa biologik ahamiyatga ega joylarni o'z ichiga olgan xususiyatlar jadvalini o'z ichiga oladi. Xususiyatlar jadvali birlashtirilgan DDBJ/GENBANK/GenBank Xususiyatlar jadvali ta'rifiga amal qiladi (uning nusxasini EBI tarmoq serveridan olish mumkin). Zarur bo'lganda, yozuvlar SWISS-PROT, Eukaryotic Promoter ma'lumotlar bazasiga o'zaro havola qilinadi ( kodlash hududlari va boshqa biologik ahamiyatga ega joylarni o'z ichiga oladi. Xususiyatlar jadvali birlashtirilgan DDBJ/GENBANK/GenBank Xususiyatlar jadvali ta'rifiga amal qiladi (uning nusxasini EBI tarmoq serveridan olish mumkin). Zarur bo'lganda, yozuvlar SWISS-PROT, Eukaryotic Promoter ma'lumotlar bazasiga o'zaro havola qilinadi ( kodlash hududlari va boshqa biologik ahamiyatga ega joylarni o'z ichiga oladi. Xususiyatlar jadvali birlashtirilgan DDBJ/GENBANK/GenBank Xususiyatlar jadvali ta'rifiga amal qiladi (uning nusxasini EBI tarmoq serveridan olish mumkin). Zarur bo'lganda, yozuvlar SWISS-PROT, Eukaryotic Promoter ma'lumotlar bazasiga o'zaro havola qilinadi, TransFac yoki Flybase. Xususiyatlar jadvali kvalifikatori '/db_xref' tashqi ma'lumotlar bazalariga o'zaro havolalarni ifodalaydi. Masalan, CDS funksiyasidan “FLYBASE” ma’lumotlar bazasiga o‘zaro havola bu xususiyat berilgan identifikator bilan FLYBASE ma’lumotlar bazasidagi ob’ektga (masalan, gen nomi) mos kelishini bildiradi, masalan, /db_xref='FLYBASE:FBgn0012052'.
Do'stlaringiz bilan baham: |