SWISS-PROT va TrEMBL o'rtasidagi formatdagi farqlar. TrEMBL tomonidan qo'llaniladigan format va konventsiyalar iloji boricha yaqindan amal qiladi. SWISS-PROT. Shuning uchun qo'shimcha ishlab chiqarish kerak emas. Foydalanuvchi qo'llanmasi va TrEMBL uchun keng qamrovli nashr yozuvlari. Berilgan ma'lumotlar SWISS-PROT relizlar uchun eslatmalar va foydalanuvchi qo'llanmasi umuman amal qiladi TREMBL. Farqlar quyida keltirilgan.
Yozuvning umumiy tuzilishi SWISS-PROT va TrEMBLda bir xil. TrEMBL da (ID qatorida) foydalaniladigan maʼlumotlar klassi har doim “PRELIMINARY” boʻladi, SWISS-PROTda esa har doim "STANDART". SWISS-PROT va TrEMBLda mavjud chiziq turlaridagi farqlar:
ID liniyasi (identifikatsiya):
SP-TrEMBL da qo'llaniladigan kirish nomi kirish raqami bilan bir xil
kirish. REM-TrEMBL da ishlatiladigan kirish nomi PID ga teglangan
EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasida tegishli CDS. "PID" qisqartmasi
"Oqsil identifikatori" raqami. Bu siz topadigan raqam
EMBL nukleotidlar ketma-ketligi "/db_xref" deb nomlangan kvalifikatsiyadagi yozuvlar
nukleotidlar ma'lumotlar bazasidagi har bir CDSga teglangan.
I-bob. Adabiyotlar sharxi. Ketma-ket ma'lumotlar bazalariga bo'lgan ehtiyoj 1950 yilda Fredrik Sanger insulinning asosiy tuzilishi haqida xabar berganida paydo bo'lgan. U nuklein kislotalarni sekvensiyalash usullarini yaratish uchun ikkinchi Nobel mukofotini qo'lga kiritdi va uning qiyosiy yondashuvi boshqa protein biokimyogarlarini aminokislotalar ketma-ketligini to'plashni boshlashga undadi. Shunday qilib, molekulyar ma'lumotlar bazalarining boshlanishi.
1965 yilda Margaret Dayhoff va uning jamoasi Milliy biotibbiyot tadqiqotlari jamg'armasi (NBRF) "Oqsillar ketma-ketligi va tuzilishi atlasi" ni nashr etdilar. Ular Atlasga barcha ma'lum protein ketma-ketliklarini , hatto nashr etilmagan materialni ham qo'yishdi. Buni molekulyar ma'lumotlar bazasini yaratishga qaratilgan birinchi urinish sifatida ko'rish mumkin. Ular Milliy Sog'liqni saqlash institutlarida (NIH) yangi kompyuterlashtirilgan (1964) Tibbiy adabiyotlarni tahlil qilish va qidirish tizimidan (MEDLARS) foydalanishdi. Jamoa ma'lumotlarni saqlash uchun kompyuterlardan foydalangan, biroq har bir ketma-ketlikni qo'lda terish va tekshirishga to'g'ri keldi, bu vaqt va pul uchun katta xarajatga ega edi.
1966 yilda jamoa Atlasning ikkinchi nashrini chiqardi, bu birinchisidan ikki baravar katta. U 1000 ga yaqin ketma-ketlikni o'z ichiga olgan va bu safar axborot portlashi sifatida yaratilgan. Milliy Biotibbiyot Tadqiqot Jamg'armasi (NBRF) o'sha paytda tibbiyot va biologiya uchun kompyuterlardan foydalanishning eng yuqori bosqichida edi. Dayhoff va uning jamoasi asosiy kompyuterlarda oqsil molekulalarining aminokislotalar ketma-ketligini aniqlash uchun o'z imkoniyatlaridan foydalangan. Topilgan ketma-ketliklar soni o'sishda davom etdi, bu esa oqsillarni har qachongidan ham chuqurroq qiyosiy tahlil qilish imkonini beradi. Bu aminokislotalarni almashtirishning ehtimollik modellari, ketma-ketlikni tekislash va oqsillarning evolyutsion munosabatlarining filogenetik daraxtlari kabi ko'plab o'zgarishlarga olib keladi. Butun ketma-ketlik jarayoni to'liq avtomatlashtirildi.
Birinchi nukleotidlar ketma-ketligi ma'lumotlar bazasi yaratildi. Ilgari Evropa molekulyar biologiya laboratoriyasi (EMBL) nukleotidlar ketma-ketligi ma'lumotlar kutubxonasi (hozirda Evropa nukleotid arxivi sifatida tanilgan) sifatida tanilgan. Inson genomi loyihasi 1988 yilda boshlangan. Loyihaning maqsadi insondagi barcha genlarning ketma-ketligi va xaritasini yaratish edi, bu esa katta ketma-ketlik ma'lumotlar bazasini yaratish va undan foydalanish qobiliyatini talab qiladi.
Endi bizda ko'plab ketma-ketlik ma'lumotlar bazalari, ulardan foydalanish vositalari va ularga oson kirish mumkin. Eng yiriklaridan biri GenBank bo'lib, u 2 milliarddan ortiq ketma-ketlikni o'z ichiga oladi.