Gen tuzoqlari ketma-ketligini genomik lokalizatsiya qilish usullarini taqqoslash



Download 0,66 Mb.
bet1/8
Sana20.06.2022
Hajmi0,66 Mb.
#678891
  1   2   3   4   5   6   7   8
Bog'liq
7-а-Документ Microsoft Word (2)


https://bmcgenomics.biomedcentral.com/articles/10.1186/1471-2164-7-236


Gen tuzoqlari ketma-ketligini genomik lokalizatsiya qilish usullarini taqqoslash
Kortni Harper ,Konrad C Huang ,Dag Stryke ,Michiko Kawamoto ,Tomas E Ferrin vaPatrisiya C Babbitt
BMC genomikasi hajmi 7 , Maqola raqami: 236 ( 2006 ) Ushbu maqolani keltiring

6392 kirish


1 Iqtiboslar


Ko'rsatkichlartafsilotlar


Abstrakt
Fon


Sichqoncha kabi model organizmdagi gen nokautlari asosiy biologiya va inson kasalliklarini o'rganish uchun qimmatli manba bo'lib xizmat qiladi. Qaysi genning maqsadsiz genni tutib olish hodisasi tomonidan inaktivlanganligini aniqlash qiyin izohlash muammosini keltirib chiqaradi, chunki tutilgan genning vektor kiritish joyi yaqinidagi ketma-ketlikni ifodalovchi gen tuzoqlari ketma-ketligi teglari odatda qisqa va ko'pincha hal qilinmagan qoldiqlarni o'z ichiga oladi. Sichqoncha genomida ushbu ketma-ketliklarning lokalizatsiyasini yaxshiroq tushunish uchun biz BLAT, SSAHA va MegaBLAST moslashtirish dasturlarining mustaqil versiyalarini solishtirdik. Har bir algoritm uchun standart parametrlardan foydalangan holda sichqonchaning 34 genomini yaratish uchun 3369 ta ketma-ketlik teglari toʻplami moslashtirildi. Lokalizatsiya natijalarini baholash uchun to'liq uzunlikdagi genlar (1659 ketma-ketlik) uchun ma'lum genom koordinatalari ishlatilgan.


Natijalar
Umuman olganda, uchta dastur ham genomning umumiy hududiga ketma-ketliklarni lokalizatsiya qilish nuqtai nazaridan yaxshi ishladi, faqat ketma-ketlik teglarining kichik bir qismi uchun nisbatan nozik xatolar aniqlandi. Biroq, ekson chegaralarini to'g'ri aniqlashda ishlashdagi katta farqlar qayd etildi. BLAT ekzon chegaralarining katta qismini to'g'ri aniqladi, SSAHA va MegaBLAST esa ekzon chegaralarining aksariyat qismini o'tkazib yubordi. SSAHA doimiy ravishda eng kam noto'g'ri musbatlar haqida xabar berdi va eng tezkor algoritmdir. MegaBLAST tezligi bo'yicha BLAT bilan solishtirish mumkin edi, lekin ketma-ketlik teglarini psevdogenlarga noto'g'ri mahalliylashtirishga eng sezgir edi.


Xulosa
Ketma-ket teglar va to'liq uzunlikdagi mos yozuvlar ketma-ketliklari uchun ishlashdagi farqlar hayratlanarli darajada kichik edi. Har bir dastur bo'yicha mahalliylashtirish natijalarining xarakterli o'zgarishlari qayd etildi, bu, xususan, ekzon chegaralarida ketma-ketlikni lokalizatsiya qilishga ta'sir qiladi.
Fon
Yuqori o'tkazuvchanlik genlarini uzilish loyihalari [ 1 ] o'rganish uchun mavjud bo'lgan funktsiyani yo'qotadigan nokaut genlari sonini sezilarli darajada oshirdi . Ushbu genlarning to'g'ri identifikatsiyasi ulardan biotibbiyot kashfiyoti uchun foydalanish uchun zarur asos bo'lib xizmat qiladi, shu jumladan amalga oshirilishi kerak bo'lgan ko'p vaqt talab qiladigan fenotipli tajribalar sonini minimallashtirish. Yaqin vaqtgacha uzilgan nokaut genlari, birinchi navbatda, BLAST [ 2 ] moslashtirish dasturidan foydalanib, buzilish joyi yaqinidagi uzilgan gen hududini ifodalovchi gen tuzoqlari ketma-ketligi teglarini gen transkriptlari bilan moslashtirish uchun aniqlangan. Transkriptni identifikatsiya qilish, odatda, bunday nokautlarning 75 % dan ortig'i uchun yuqori ishonchli gen annotatsiyasi ma'lumotlarini taqdim etishi mumkin.], transkript ma'lumotlar bazalari genomning to'liq qamrab olinishini ta'minlamaydi, bu aniqlanishi mumkin bo'lgan genlar sonini cheklaydi. Transkript ma'lumotlar bazalarining ortiqcha bo'lishi ham nisbatan qisqa bo'lgan ketma-ketlik teglari uchun noyob identifikatsiyani olishni qiyinlashtiradi.
Ketma-ketlik sifati gen tuzoqlari ketma-ketligi teglari bilan ham muammo bo'lishi mumkin, chunki bu teglarni yaratishning keng tarqalgan usuli ko'pincha nisbatan past sifatli ketma-ketlikni keltirib chiqaradi. BayGenomics [ 3 ] va Xalqaro Gen Trap Konsorsiumining (IGTC) boshqa a'zolari [ 4 , 5 ] odatda 5' RACE [ 6 ] dan foydalanadilar.], genlarni kiritish hodisalaridan ketma-ketlikni kuchaytirishning umumiy usuli. Bu usul DNKning faqat bitta zanjiridan ketma-ketlikni hosil qiladi va ko'pincha nisbatan qisqa ketma-ketliklarni hosil qiladi, ketma-ketlik xatolari ayniqsa 3' oxirigacha to'planadi. Ko'pgina genlarni noyob tarzda aniqlash uchun etarlicha uzun ketma-ketlik teglarini olish uchun, masalan, BayGenomics, umumiy qabul qilingan chegaradan past bo'lgan asosiy qo'ng'iroqning maqbul sifati chegarasidan foydalanadi (Phred [ 7 ] minimal ball 14,6 emas. standart ball 30) [ 3 ]. Bunday past chegaradan foydalanishning oqibati shundaki, nukleotidlar standart chegara qiymatiga qaraganda bir oz ko'proq noto'g'ri tayinlanadi. Bu muammo izohga xalaqit berishi mumkin. [ Qo'shimcha fayl 1- ga qarangMisol uchun.] Bundan tashqari, 5' RACE tomonidan yaratilgan ketma-ketlik teglari vaqti-vaqti bilan ularning uchlarida shablonlanmagan nukleotidlarga ega bo'ladi [ 8 ]. Keng miqyosdagi 5' RACE tajribasida klonlarning atigi 57% gen transkripti bilan moslashish orqali aniqlanishi uchun etarlicha uzun va bir ma'noli ketma-ketliklarni yaratdi [ 9 ].
Sichqoncha genomining kuratsiyasi yaxshilanganligi sababli, to'g'ridan-to'g'ri lokalizatsiya ketma-ketlik teglarini o'ziga xos genlar bilan bog'lash uchun tanlangan strategiyaga aylandi. Bu mRNK ma'lumotlar bazalarida ortiqchalikdan kelib chiqadigan noaniq va chalkash izohlarni minimallashtirishda afzalliklarga ega. Bundan tashqari, bu yondashuv genomik ketma-ketlikka reportyor genini kiritishning biologik haqiqatini aks ettiradi va uni genom brauzerining veb-saytlarida mavjud bo'lgan ko'plab turdagi ma'lumotlar bilan bog'lash orqali genning kontekstga asoslangan ko'rinishini ta'minlaydi.
Genomdagi ketma-ketliklarni lokalizatsiya qilishda moslashish dasturini tanlash muhim ahamiyatga ega. Evolyutsion ravishda ajralib chiqqan ketma-ketliklarni taqqoslash uchun ishlab chiqilgan BLAST ushbu ilovada juda sekin. Deyarli bir xil ketma-ketliklarni tezda tekislash uchun bir qancha yangi algoritmlar ishlab chiqilgan. Umumiy foydalanishdagi ilovalar MegaBLAST [ 10 ], Sequence Search and Alignment by Hashing Algoritm (SSAHA) [ 11 ] va BLAST-like Alignment Tool (BLAT) [ 12 ]. Ularning har biri hozirda asosiy genom brauzer saytlaridan birida qo'llanilmoqda va qo'shimcha ravishda har biri alohida foydalanish uchun mavjud. MegaBLAST Milliy Biotexnologiya Axborot Markazida (NCBI) [ 13 ], SSAHA esa Ansamblda [14] ishlatiladi .], va BLAT Kaliforniya Santa Cruz universitetida (UCSC) qo'llaniladi [ 15 ]. Ushbu algoritmlarning barchasi genom brauzerlari uchun individual ravishda taqqoslangan bo'lsa-da, ularning ketma-ketlik teglari bilan ishlashi o'rnatilmagan va ushbu dasturlarning mustaqil versiyalari natijalari quyidagi manzilda mavjud bo'lgan gen izohlari bilan taqqoslanmagan. genom brauzer saytlari. Past sifatli va qisqa ketma-ketlik uzunligining genlarni lokalizatsiya qilish protokollariga ta'sirini aniqlash gen yorlig'i va shunga o'xshash ketma-ketliklar, shu jumladan boshqa turdagi ifodalangan ketma-ketlik teglari (EST) yoki genomik teglar bilan ishlaydigan tadqiqot guruhlari uchun foydalidir.
MegaBLAST BLASTga o'xshaydi, chunki u so'rovlar ketma-ketligini bir-biriga mos kelmaydigan bo'laklarga ajratadi va eng yuqori identifikatsiyaga ega bo'lgan hududlarni topish uchun genomga aniq mos keladiganlarni qidiradi. Keyinchalik bu mukammal mosliklar sezilarli o'xshashlikning eng uzun mintaqasini tekislash uchun kengaytiriladi. MegaBLAST BLASTga nisbatan soddalashtirilgan boʻshliq va qoʻshish/oʻchirish jazolarini oʻz ichiga olgan ochkoʻz algoritmdan foydalanadi va moslashtirishni mukammal moslik urugʻidan tashqariga kengaytirishda oʻrganilishi kerak boʻlgan tekislashlar sonini cheklaydi. Ushbu o'zgartirishlar so'rovlar va ma'lumotlar bazasi ketma-ketligi o'rtasida kutilayotgan o'xshashlikning yuqori darajasi va moslashtirishda ko'p nomuvofiqliklar yoki bo'shliqlar bo'lmasligi kutilganligi sababli oqlanadi. 97% dan ortiq identifikatsiyaga ega ketma-ketliklar uchun MegaBLAST hizalanish aniqligini yo'qotmasdan BLASTga qaraganda tezroq kattalik tartibidir [10 ].
SSAHA so'rovlar ketma-ketligi va genom o'rtasida kutilgan yuqori o'xshashlikdan foydalanish uchun boshqa yondashuvdan foydalanadi. Genom ketma-ketligidan belgilangan uzunlikdagi ( k ) bir-biriga yopishmaydigan barcha fragmentlar indeksi yaratiladi va tegishli pozitsiyalar bilan saqlanadi. So'rovlar ketma-ketligi va uning teskari to'ldiruvchisi k uzunlikdagi barcha mumkin bo'lgan bo'laklarga , shu jumladan bir-biriga o'xshash bo'laklarga bo'linadi va aniq mosliklarni aniqlash uchun genom indeksi bilan solishtiriladi. Sukut bo'yicha 2 k ga o'rnatilgan chegaradan oshib ketgan taqdirda xabar beriladigan qo'shni mos segmentlarni topish uchun mosliklar saralanadi . SSAHA juda tez, lekin genom indeksi va fragmentlarning joylashuvini saqlash zarurati tufayli nisbatan katta xotira talablari mavjud.
BLAT ko'p bosqichli algoritmdan foydalanadi, u o'xshashlik hududlarini qidiradi, bu hududlarni tekislaydi, yaqin joylashgan hududlarni to'playdi va kanonik ulanish joylariga mos keladigan tekislangan hududlar chegaralarini sozlaydi. Dastlabki qidiruv bosqichi SSAHAga juda o'xshash tarzda ishlaydi. Genom ma'lumotlar bazasi k uzunlikdagi bir-biriga mos kelmaydigan bo'laklarga bo'linadi , so'ngra so'rovlar ketma-ketligining barcha k - uzunlikdagi qismlari va uning teskari to'ldiruvchisi genomdagi mos keladigan joylar bilan bog'lanadi. Gugurtlar yaqinlik va genomning kamida 2 k bo'lgan hududlari bo'yicha saralanadi va guruhlanadi.qo'shni mosliklar so'rovlar ketma-ketligiga mos keladi. Moslash bosqichi mos keladigan hududlarni iloji boricha kengaytiradi, bir-biriga mos keladigan mosliklarni birlashtiradi, genom bo'yicha tartibda tushadigan mosliklarni bitta hizalamaga bog'laydi va so'rov va genom ketma-ketligidagi bir xil uzunlikdagi bo'shliqlarga mos keladigan hizalanish hududlarini to'ldiradi. Intronlarga mos kelishi mumkin bo'lgan hizalanishdagi bo'shliqlarning pozitsiyalari iloji boricha konsensus ulanish joyi GT/AG bilan moslashtiriladi.
Bu yerda xabar qilingan ish SSAHA, MegaBLAST va BLAT ning mustaqil versiyalarining sichqonchani gen tuzog'i ketma-ketlik teglari to'plami uchun ishlashini taqqoslashni ta'minlaydi. Ketma-ket teglar maqsadsiz gen-tuzoq tajribalari orqali yaratilgan bo'lib, ular kiritish vektori embrion ildiz hujayralarida ifodalangan gen intronini to'xtatib qo'ygan holatlarni aniqlaydi [ 1 ]. Bizning ketma-ketlik teglarimizning genom koordinatalari noma'lumligi sababli, ularning qarindosh genlarining lokalizatsiyasi proksi sifatida ishlatilgan. Ushbu genlar ketma-ketlik teglarini gen transkriptlari bilan moslashtirish uchun BLAST dasturi yordamida aniqlangan (batafsil ma'lumot uchun usullarga qarang).
Sichqoncha genomidagi ko'plab genlarning genom koordinatalari qaysi genom brauzer saytida ma'lumot taqdim etishiga qarab turlicha aniqlanadi. Buning sababi shundaki, har bir brauzer o'zlarining yakuniy izohlarini olish uchun mahalliylashtirish dasturlari, ketma-ketlikni tahlil qilish vositalari va qo'lda kuratsiyaning turli kombinatsiyasidan foydalanadi. Bundan tashqari, annotatsiya protokolida ishlatiladigan mahalliylashtirish dasturi genom brauzeri foydalanuvchilariga taqdim etilgan mahalliylashtirish dasturidan farq qilishi mumkin. Masalan, Ensembl exonerate dasturidan foydalanadi [ 16] o'z saytida xabar qilingan mahalliylashtirish koordinatalarini yaratish. Biroq, foydalanuvchi Ensembl saytida genni mahalliylashtirishga harakat qilganda, bu vazifani bajarish uchun SSAHA algoritmidan foydalaniladi. Bu NCBI va UCSC dan farq qiladi, bu yerda mos ravishda MegaBLAST va BLAT genomi uchun izohlarni yaratish uchun foydalaniladigan lokalizatsiya algoritmlari foydalanuvchilar tomonidan kiritilgan ketma-ketlikni lokalizatsiya qilish uchun genom brauzeri tomonidan ham qo'llaniladi. Algoritmlar o'rtasida adolatli taqqoslashni ta'minlash uchun ushbu tadqiqotda faqat Ensembl, NCBI va UCSCda bir xil koordinatalarga ega bo'lgan genlar bilan mos keladigan ketma-ketlik teglari ishlatilgan. Ushbu dasturlarning mustaqil versiyalaridan foydalangan holda ketma-ketlik teglarini lokalizatsiya qilishdagi xatolar ketma-ket teglarning o'ziga xosligi yoki mustaqil dasturlarning ular ishlatiladigan protokolga nisbatan ishlashidagi farqlar bilan bog'liqligini aniqlash. har bir brauzer saytida to'liq uzunlikdagi genlarni lokalizatsiya qilish, shuningdek, biz nazorat sifatida ketma-ketlik teglari bilan mos keladigan gen transkriptlari to'plamini mahalliylashtirdik. Bizning ketma-ketlik to'plamimiz sichqon genomida bir xil tayinlangan koordinatalarga ega bo'lgan 1659 gen bilan bog'langan 3369 ta ketma-ketlik teglaridan iborat edi.



Download 0,66 Mb.

Do'stlaringiz bilan baham:
  1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish