O‘ZBEKISTON RESPUBLIKASI OLIY TA’LIM VAZIRLIGI
Urganch Davlat Universiteti
Tabiiy fanlar fakulteti biologiya yo’nalishi
181-guruh talabasi Mengliboyev Yurufboyning
Bioinformatika fanidan
KURS ISHI
Mavzu: Oqsil ketma-ketliklari bazalari-TrEMBL.
Bajardi: Mengliboyev Yurufboy
Tekshirdi:
Urganch 2022
REJA:
Kirish.
I bob. Adabiyotlar sharxi.
II bob. Asosiy qism.
2.1. TrEMBL-oqsil ketma-ketliklari bazalari.
2.2. SWISS-PROT protein ketma-ketligi ma'lumotlar bazasi va uning qo'shimchasi TreEMBL 2000 yilda.
2.3. UniProt haqida.
III bob. Xulosa.
Foydalanilgan adabiyotlar.
Kirish.
TrEMBL - bu kompyuterda izohlangan proteinlar ketma-ketligi ma'lumotlar bazasi SWISS-PROT Proteinlar ketma-ketligi ma'lumotlar banki. TrEMBL ning tarjimalarini o'z ichiga oladi EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasida mavjud bo'lgan barcha kodlash ketma-ketliklari (CDS) hali SWISS-PROT-ga integratsiyalanmagan. TrEMBLni dastlabki deb hisoblash mumkin SWISS-PROT bo'limi. Nihoyat bo'lishi kerak bo'lgan barcha TrEMBL yozuvlari uchun standart SWISS-PROT sifatiga, SWISS-PROT ulanish raqamlariga yangilandi tayinlanganlar.
Davom etayotgan genlarni sekvensiyalash va xaritalash loyihalari keskin tus oldi SWISS-PROT ga qo'shiladigan protein ketma-ketliklari sonini oshirdi. Biz SWISS-PROT sifat standartlarini birlashtirish orqali susaytirmoqchi emasmiz to'g'ri ketma-ketlik tahlili va izohsiz ketma-ketliklar, lekin biz buni xohlaymiz ketma-ketliklarni imkon qadar tezroq mavjud qiling. TrEMBL bu soniyaga erishadi maqsad va keyingi tezlashtirish jarayonidagi asosiy qadamdir annotatsiyani standart SWISS-PROT sifatiga oshirish. Ortiqchalik muammosini hal qilish uchun barcha kodlashning tarjimalari EMBL nukleotidlar ketma-ketligi ma'lumotlar bazasiga allaqachon kiritilgan ketma-ketliklar (CDS). SWISS-PROT da TreEMBL dan olib tashlandi.
Biz ushbu qo'shimchani asboblardan beri TreEMBL (EMBL dan tarjima) deb nomlaymiz CDS tarjimalarini yaratishda foydalaniladi, dasturga asoslanadi EMBL da Thure Etzold tomonidan yozilgan "trembl".
Ushbu TrEMBL versiyasining maqsadi SWISS-PROT bilan sinxronlashtirishga erishishdir 37.0 versiyasi. Shuning uchun, SWISS-PROT 37.0 versiyasida mavjud bo'lgan barcha ketma-ketlik yozuvlari TrEMBL 9-versiyasidan olib tashlandi, mavjud TrEMBL yanada yangilandi yozuvlarga erishildi va faqat bir nechta yangi yozuvlar kiritildi.
TrEMBL 9-versiyasida 59'461'791 aminokislotadan iborat 221422 ta ketma-ketlik yozuvlari mavjud.
kislotalar.
TrEMBL ikkita asosiy bo'limga bo'lingan: SP-TrEMBL va REM-TrEMBL:
SP-TrEMBL (SWISS-PROT TrEMBL) yozuvlarni (179'066) o'z ichiga oladi.
oxirida SWISS-PROT tarkibiga kiritildi. SWISS-PROT ulanish raqamlari mavjud
barcha SP-TrEMBL yozuvlari uchun tayinlangan.
SP-TrEMBL quyi bo'limlarda tashkil etilgan:
arc.dat (Archea): 7315 ta yozuv
fun.dat (Qo'ziqorin): 5862 yozuv
hum.dat (Inson): 7594 ta yozuv
inv.dat (umurtqasizlar): 22665 ta yozuv
mam.dat (Boshqa sutemizuvchilar): 2792 ta yozuv
mhc.dat (MHC oqsillari): 3981 ta yozuv
org.dat (Organelles): 13996 ta yozuv
phg.dat (Bakteriofaglar): 1736 ta yozuv
pln.dat (O'simliklar): 14626 ta yozuv
pro.dat (Prokaryotlar): 39243 ta yozuv
rod.dat (Kemiruvchilar): 6863 ta yozuv
unc.dat (Tasniflanmagan): 44 ta yozuv
vrl.dat (Viruslar): 48436 yozuv
vrt.dat (Boshqa umurtqali hayvonlar): 3913 ta yozuv
SP-TrEMBL-ga 407 ta yangi yozuvlar kiritilgan. ning ketma-ketligi
979 ta SP-TrEMBL yozuvlari yangilandi va izoh yangilandi
22'224 ta yozuv.
deleteac.txt hujjatida siz barcha kirish raqamlari ro'yxatini topasiz
TrEMBL ma'lumotlar bankida mavjud bo'lgan, ammo hozir o'chirilgan
ma'lumotlar bazasi.
REM-TrEMBL (Qolgan TrEMBL) biz bajaradigan yozuvlarni (42'356) o'z ichiga oladi.
SWISS-PROTga qo'shishni istamayman. REM-TrEMBL yozuvlari qo'shilmaydi. Ushbu bo'lim beshta kichik bo'limda tuzilgan:
1) Immunoglobulinlar va T-hujayra retseptorlari (Immuno.dat)
Aksariyat REM-TrEMBL yozuvlari immunoglobulinlar va T-hujayra retseptorlaridir. Biz SWISS-PROTga immunoglobulinlar va T-hujayra retseptorlarini kiritishni to'xtatdi, chunki biz faqat mikrob chizig'i genidan olingan tarjimalarni saqlamoqchimiz, bu oqsillarning SWISS-PROT-da va barcha ma'lum somatik rekombinatsiyalanmagan bu oqsillarning o'zgarishi. Biz ixtisoslashgan korxona yaratmoqchimiz. Qo'shimcha sifatida ushbu ketma-ketliklar bilan shug'ullanadigan ma'lumotlar bazasi
SWISS-PROT va bularning faqat vakillik kesimini saqlang SWISS-PROTdagi oqsillar.
2) Sintetik ketma-ketliklar (Synth.dat)
SWISS-PROTga kiritilmaydigan ma'lumotlarning yana bir toifasi sintetik ketma-ketliklar. Shunga qaramay, biz ushbu yozuvlarni qoldirishni xohlamaymiz. Ideal holda sun'iy ma'lumotlar bazasini yaratish kerak, ketma-ketliklar SWISS-PROTga qo'shimcha qo'shimcha sifatida.
3) Patentga ariza berish ketma-ketligi (Patent.dat)
Uchinchi kichik bo'lim patentdan olingan kodlash ketma-ketliklaridan iborat ilovalar. Bu yozuvlarni chuqur o‘rganish shuni ko‘rsatdi, juda kichik ozchilikdan tashqari (ko'p hollarda allaqachon mavjud SWISS-PROT-ga integratsiya qilingan), bu ketma-ketliklarning aksariyati ikkalasini ham o'z ichiga oladi. Noto'g'ri ma'lumotlar yoki undan tashqarida sun'iy ravishda yaratilgan ketma-ketliklarga tegishli SWISS-PROT doirasi.
4) Kichik qismlar (Smalls.dat)
Yana bir kichik bo'lim sakkizdan kam amino bo'lgan qismlardan iborat kislotalar.
5) CDS haqiqiy oqsillarni kodlamaydi (Pseudo.dat)
Oxirgi bo'lim CDS tarjimalaridan iborat bo'lib, bizda kuchli. Ushbu CDS haqiqiy oqsillarni kodlamasligiga ishonish uchun dalillar.
Do'stlaringiz bilan baham: |