Gen tuzoqlari ketma-ketligini genomik lokalizatsiya qilish usullarini taqqoslash


-jadval Har bir algoritm uchun soniyalarda hisoblash vaqtlari



Download 0,66 Mb.
bet3/8
Sana20.06.2022
Hajmi0,66 Mb.
#678891
1   2   3   4   5   6   7   8
Bog'liq
7-а-Документ Microsoft Word (2)

1-jadval Har bir algoritm uchun soniyalarda hisoblash vaqtlari.
Kimdan: Gen tuzoqlari ketma-ketligini genomik lokalizatsiya qilish usullarini taqqoslash



Hisoblash vaqti soniyalarda


Ketma-ketlik #

MegaBLAST

SSAHA a

BLAT a

To'liq uzunlikdagi genlar

3320

1767 (40578) b

361 (29895)

1434 (204331)

Ketma-ket teglar

7043

223 (1025)

38 (5806)

276 (854)

a SSAHA va BLAT uchun hisobot qilingan hisoblash vaqtlari genomni oldindan indekslashni o'z ichiga olmaydi (matnga qarang).
b Takroriy niqoblangan genomdan foydalangan natijalar birinchi navbatda, keyin esa qavs ichida niqoblanmagan genom natijalari keltirilgan.

Mahalliylashtirish dasturlari tomonidan ko'rsatilgan deyarli mukammal eslab qolishdan farqli o'laroq, dasturlarning aniqligi noto'g'ri ijobiy holatlarning sezilarli darajada ko'pligidan aziyat chekadi ( 1A -rasm ). Gen darajasida barcha xabar qilingan to'liq uzunlikdagi gen lokalizatsiyalarining 46% va SSAHA tomonidan ketma-ketlik yorlig'i lokalizatsiyasining 16% ma'lum gen lokalizatsiyasi bilan mos kelmaydi. MegaBLAST uchun xabar qilingan gen lokalizatsiyasining 43% va ketma-ketlik yorlig'i lokalizatsiyasining 15% noto'g'ri ijobiydir. BLAT xuddi shunday samaradorlikni ko'rsatadi, xabar qilingan gen lokalizatsiyasining 38% va ketma-ketlik yorlig'ining lokalizatsiyasining 15% ma'lum gen hududidan tashqarida joylashgan. Umuman olganda, noto'g'ri musbatlar haqiqiy ijobiylardan sezilarli darajada pastroq.


Gen darajasidagi noto'g'ri pozitivlar muammoli bo'lmasligi mumkin, ammo mahalliylashtirish natijalarini sharhlashning eng keng tarqalgan usuli barcha qaytarilgan o'yinlarni tahlil qilish o'rniga eng yuqori ball to'plagan moslikni to'g'ri deb qabul qilishdir. To'g'ri lokalizatsiyalar odatda uzoq, yuqori foizli mosliklarni ko'rsatadi, bu esa odatda qisqa yoki nomuvofiqliklarni o'z ichiga olgan noto'g'ri mosliklarga nisbatan yuqori ball olishga yordam beradi. Yuqori zarbani olish strategiyasi to'liq uzunlikdagi gen so'rovlari va ketma-ketlik yorlig'i so'rovlari bilan katta darajada muvaffaqiyatli bo'ladi ( 1A -rasm).). Eng yuqori ballga ega bo'lgan SSAHA lokalizatsiyasi deyarli har doim to'g'ri, chunki u to'liq uzunlikdagi gen so'rovlarining 99% va ketma-ketlik yorlig'i so'rovlarining 98% uchun genning ma'lum lokalizatsiyasi bilan mos keladi. Eng yuqori ballga ega bo'lgan MegaBLAST lokalizatsiyasi to'liq uzunlikdagi gen so'rovlarining 93% va ketma-ketlik yorlig'i so'rovlarining 95% uchun to'g'ri keladi. Eng yuqori ballga ega bo'lgan BLAT lokalizatsiyasi to'liq uzunlikdagi gen so'rovlarining 99% va ketma-ketlik yorlig'i so'rovlarining 99% uchun to'g'ri.
Noto'g'ri o'yinlar, shuningdek, ekzon tartibida kuzatilgan to'g'ri mosliklarga qaraganda, xromosomada birlashish ehtimoli kamroq. Har uchala dastur ham xromosomalar boʻyicha guruhlangan oʻyinlar haqida xabar bergan boʻlsa-da, faqat BLAT algoritmi bir-biriga yaqin boʻlgan oʻyinlarni bitta koʻp qismli hizalamaga birlashtiradi, unga moslashishdagi individual mosliklarning ballarini birlashtiruvchi ball beriladi. Bu yuqori ball to'plagan o'yin bir xil genning ekzonlari bo'lishi mumkin bo'lgan barcha mosliklarning kompozitsiyasi ekanligini ta'minlaydi. Ushbu guruhlashning yana bir natijasi shundaki, to'g'ri va noto'g'ri o'yinlar ballari SSAHA yoki MegaBLASTga qaraganda kengroq ajratilgan.

Pseudogenlar


Pseudogenlarning mavjudligi to'liq uzunlikdagi genlar va ketma-ketlik teglari uchun gen darajasida to'g'ri va noto'g'ri moslikni ajratish qoidalarini chalkashtirib yuborishi mumkin. Psevdogenlar - bu genomning ma'lum genlarga ketma-ketligi bo'yicha juda o'xshash bo'lgan hududlari, lekin odatda mutatsiyalar yoki transkripsiya yoki translatsiyani oldini oluvchi etishmayotgan elementlar tufayli ishlamaydi. Psevdogenlarning 80% ga yaqini qayta ishlangan psevdogenlar bo'lib, ular genomga integratsiyalashgan qisman yoki to'liq uzunlikdagi mRNK ketma-ketligiga o'xshaydi [ 18 ]]. Bular ikki zanjirli DNKning genomga retrotranspozitsiyasi, bir zanjirli RNKning o'qilishi natijasida yuzaga keladi. Qayta ishlangan psevdogenlarda intronlar yo'qligi sababli, psevdogenlar va alohida eksonlarga qaraganda uzunroq so'rovlar ketma-ketligi o'rtasida tekislashlar tuzilishi mumkin. Bunday hizalamalar etarlicha uzun bo'lishi mumkinki, nomuvofiqliklar uchun hisoblangan jazolar bu uzunroq o'yin uzunligi bilan qoplanadi, bu ularga eksonlarga to'g'ri mosliklardan ustun turish imkonini beradi. Bizning ketma-ketlik teglarimiz holatida, bu hizalamalar doimo noto'g'ri bo'ladi, chunki bizning genlarni ushlab turish usuli bilan genning buzilishi faqat vektor intronga kiritilganda aniqlanadi [ 1 ]. 2 -rasmqayta ishlangan psevdogenga lokalizatsiyani lokalizatsiyadan haqiqiy genga ajratish qiyinligini ko'rsatadigan misol keltiradi. Kamdan kam hollarda psevdogenlar xromosoma segmentlarining dublikatsiyasi tufayli yuzaga kelishi mumkin. Ushbu qayta ishlanmagan psevdogenlar intronlarni o'z ichiga oladi va shuning uchun faqat tekislash uzunligiga asoslangan yuqori ballli (lekin noto'g'ri) mos kelish ehtimoli kamroq. Bundan tashqari, yaqinda sodir bo'lgan takrorlanish natijasida psevdogen juda kam mutatsiyaga ega bo'lib, uni kodlovchi gendan ajratish qiyin bo'lishi mumkin. Intronlarni o'z ichiga olgan qayta ishlanmagan psevdogenga genni tutuvchi vektorni kiritish mumkin bo'lsa-da, bizning ma'lumotlar to'plamimizda hech biri aniqlanmadi va shuning uchun psevdogenlarning barcha lokalizatsiyasi noto'g'ri musbat deb hisoblanadi.

Pseudogenga lokalizatsiya misoli. 1-o'xshash 1-o'xshash mitotik tutilishni kodlovchi to'liq uzunlikdagi gen (Mad1l1), GenBank ulanishi NM_010752 uchun lokalizatsiya natijalari. So'rovlar ketma-ketligi va sichqoncha genomining 34-qurilishi o'rtasidagi moslashuvning barcha ko'rinishlari UCSC Genome Browser Custom Tracks xususiyatidan foydalangan holda amalga oshirildi. Tasvirlarga biroz oʻzgartirishlar kiritildi, jumladan, figuraning ravshanligini oshirish uchun grafik elementlar olib tashlangan, biroq hizalamalarga hech qanday oʻzgartirish kiritilmagan. (A) Genomdagi ma'lum genning koordinatalari yuqorida keltirilgan va ekzonlarning pozitsiyalari rangli bloklar bilan ifodalanadi. 5-xromosoma hududi NM_010752 ning ma'lum lokalizatsiyasini (pastki qismida ma'lum genlar izi) va SSAHA, MegaBLAST va BLAT tomonidan genomga NM_010752 eksonlarining hizalanishini o'z ichiga olgan hudud ko'rsatilgan. (B) NM_010752 ga tegishli psevdogenni o'z ichiga olgan 9-xromosoma hududi (A) bilan bir xil shkalada ko'rsatilgan. Buning ostida psevdogenni o'z ichiga olgan 9-xromosoma segmenti kattalashgan. Moviy rangda aylana boʻlgan eng yuqori ball toʻplagan MegaBLAST oʻyinida haqiqiy gen emas, balki ushbu psevdogen lokalizatsiya qilinadi. SSAHA va BLAT tomonidan qaytarilgan eng yuqori ball to'plangan o'yinlar 5-xromosomada joylashgan va to'g'ri lokalizatsiya bilan bir-biriga mos keladi.

2 -rasmda ko'rsatilganidek, genik lokalizatsiya turli darajada psevdogenlarning mavjudligi bilan buziladi. SSAHA juda o'xshash mosliklarni emas, faqat aniq mosliklarni aniqlaydi, bu algoritmga to'g'ri mosliklarni psevdogen mosliklardan ajratish nuqtai nazaridan alohida afzallik beradi. BLAT tekislashlari tekislashni kengaytirish bosqichida to'plangan nomuvofiqliklarni o'z ichiga olishi mumkin, bu esa psevdogenga yuqori ball to'g'ri kelishi ehtimolini oshiradi. Biroq, BLAT balli genom mintaqasidagi barcha mosliklarni aks ettiradi, shuning uchun agregatda qisqa mukammal yoki deyarli mukammal ekson mosliklari psevdogenlarga nisbatan uzoqroq nomukammal mosliklarni ortda qoldirishi mumkin. MegaBLAST psevdogen moslashuvlarga eng sezgir, chunki u nomuvofiqliklarga nisbatan toqat qiladi va uzoq nomukammallarga nisbatan qisqa mukammal mosliklarni afzal ko'rish mexanizmiga ega emas.


Ushbu tadqiqotda psevdogenlar so'rovlar ketma-ketligi va genom o'rtasidagi yuqori ketma-ketlik identifikatsiyasiga qaramay, noto'g'ri bo'lgan 100 dan ortiq yuqori ball to'g'ri kelishiga sabab bo'lgan bo'lishi mumkin. Pseudogenlarning noto'g'ri lokalizatsiyasining aniq sonini aniqlash qiyin, chunki nisbatan kam sonli sichqoncha psevdojenlariga izoh berilgan. 4000 ga yaqin sichqoncha psevdojenlari mavjudligi taxmin qilinmoqda [ 19 ] va yaqindan bog'liq bo'lgan inson genomida 22-xromosomaning erta tuzilishini sinchkovlik bilan o'rganish shuni ko'rsatdiki, kodlash sifatida aniqlangan ketma-ketliklarning 19% psevdogenlarga tegishli [ 20 ].]. Psevdogen moslashuvlarning dasturlar o'rtasida taqsimlanishi ularning algoritmik farqlaridan kutilganidek farq qiladi. SSAHA 17 ta toʻliq uzunlikdagi genlar va 60 ta ketma-ketlik teglari uchun ehtimoliy psevdogen sifatida izohlangan mintaqaga yuqori ball toʻplagan oʻyin haqida xabar beradi, BLAT esa 7 ta gen va 45 ta ketma-ketlik teglarini ehtimoliy psevdogenlarga notoʻgʻri joylashtiradi. MegaBLAST 116 gen va 162 ketma-ketlik teglari uchun ehtimoliy psevdogenlarga eng yuqori ball toʻgʻri kelganligi haqida xabar beradi.



Download 0,66 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish