II BOB GENLARNI KARTALASHTIRISH DASTURLARI VA ULARDA ISHLASH
2.1. Dasturlash tillari
BFAST.Ingiliz abbreviaturasidaBlat-likeFastAccurateSearchTool. Dasturni ishlab chiqarganlar, SNPvaindellarga (insertsiya + deletsiya) xatoliklariga nisbatan ta’sirchanlikni xisobga olishgan, o’tkazilgantajriba va aniqlik o’rtasidagi balans tanlanadi.
Juftlashgan uchlarning sekvenirlanishi amalga oshiriladi. Tajriba oxirida tahrirlash uchun Smita-Vatermanalgoritmidan foydalanadi. Parallel rejimda klasterda ishlay oladi. Dasturningbfast+bwa versiyasi mavjud. Illumina, ABI SOLiD 454, Helicos formatlariga ega.
BLAST. BLAST – tahrirlash vositasi. Har bir o’xshashlikda bitta almashtirish imkonini bajaradi.
Bowtie.Barrouz—Uileralgoritmidan indeksatsiya uchun foydalanadi. Dastur tezligi va xotiraning ishlashi bo’yicha optimallashtirilgan, protsessor bir nechta yadrosini ishlatishga mo’ljallangan. Bir xil sharoitda MAQ dan 35 marta, SOAP ga nisbatan 300 marta tez tezlikda ishlaydi. Ketma-ketliklar to’g’ri kelmasligiga yo’l qo’yadi. Bowtie bazasida TopHat dasturi ishlab chiqilgan, RNA-seq taxriri uchun.
BWA.BWA (biologik ketma-ketliklarni taxrirlaydi) — dastur uch komplektdan iborat: BWA-backtrack, BWA-SW va BWA-MEM. BWA-backtrack 100 juft nukleotidgacha o’qiy oladi, BWA-SW va BWA-MEM 70 dan 1 mln gacha bo’lgan uzun nukleotid qatorlarini o’qiydi. BWA-MEM dasturning oxirgi versiyasi aniq va sifatl ishlab chiqilgan.
BWA-SW va BWA-MEM ximerli ketma-ketliklarni topa oladi.
BWA-SW, Barrouza—Uilerqaytaqurishlarini Smit—Vaterman taxriri orqali foydalanadi. Uzun ketma-ketliklar bilan ishlay oladi, BLAST ga nisbatan aniq va tezroqishlaydi.
ELAND Efficient Local Alignment of Nucleotide Data ni anglatadi. Solexa kompaniyasi tomonidan ishlab chiqilgan keyinchalik Illumina sotib olgan.
paired-end – o’qishlardan foydalanadi, struktur variantlarni topa oladi, 32 juft nukleotid uzunligigacha o’qiy oladi, nukleotidketma-ketligida2 ta farqga yo’l qo’yadi, lekin indellar (insertsiya + deletsiya) bilan ishlay olmaydi.
MAQ.Geplarsiz (gep inglizcha “gap” dan olingan bo’lib, indel ya’ni qo’shimcha nukleotid yoki deletsiyani bildiradi, bo’shliqlar “-” beligi bilan belgilanadi) taxrirlaydi. single-end – ketma-ketliklarnio’qishda 3hil farqlarni topa oladi, paired-end – ketma-ketliklarni o’qishda1 farqlarga yo’l qo’yadi.
Statistik model asosida konsensus quradi.
SHRiMP.SHRiMP2 dasturiyuqorianiqlikka qaratilgan, polimorfizmli qatorlarning taxririni o’tkazadi va sekvenirlash xatoliklarini aniqlaydi.
Smit-Vaterman algoritmidan foydalanadi, 1 versiyasi ketma-ketliklarni o’qishni, 2 versiyasi esa genomni indeksatsiya qilishda foydalaniladi, shunga ko’ra katta tezlikka ega. Illumina/Solexa, Roche/454 va AB/SOLiD kompaniyalari tomonidan ketma-ketliklarni o’qishda va parallel ravishda hisoblashishlarini olib borishda qo’llaniladi.
SOAP.single-read va pair-end fragmentlarining taxririni bajaradivaasosan intronlarni aniqlashda qo’llaniladi. 2way-BWT (2BWT) indeksini ishlatish qobiliyatiga ega. SOAP3 versiyasi GPU bilan ishlashga optimallashtirilgan va maxsus GPU-2BWT indeksidan foydalanadi.
TopHat. RNA-seq taxrirlarini o’qishga moslashgan, Bowtie bazasi asosida ishlab chiqilgan. Illumina Genome Analyzer tomonidan ishlab chiqilgan va boshqa dasturlar tomonidan ishlangan taxrirlar bilan ishlaydi. 75 nukleotid qatorlarigacha bo’lgan nukleotid qatorlarini aniqlaydi, paired va single-end ni aralashtirishga yo’l qo’ymaydi.
Normal inson karyotipining barcha xromosomalarining ideogrammalari sifatidagi grafik tasviri genetik haritalardan tashqari, boshqa xromosoma haritalari ham ishlab chiqilgan: Sitogenetik harita – xromosomalarning strukturaviy elementlarini (masalan, idiogrammalarda ularning differentsial rangli bo’limlarini) o’zaro joylashish tartibini yoki nishonli DNK namunalarining gibridlanish lokuslarini (in sitida lyuminestsent gibridlanish) fazoviy tasavvuridir. Fizik harita – fizik belgilar (DNK molekulasining bo’laklari) nukleotidlar juftligida orasidagi masofalar uzunlagini tartiblashtirish hisoblanadi. Restriktsion harita – fizik harita bo’lib, DNKning restriktaza ta’sirida hosil bo’lgan bo’laklari orasidagi masofa va ularning ketma-ketligi aniqlanadi. Bu harita markerlariga restriktsion fragmentlar kiradi- restriktsiya saytlari. Organizmlarning genomini o’rganishning yakuniy maqsadi uning genetik, sitogenetik va fizikaviy haritalarini birlashtirishdir, shuningdek, ularning to’liq genom ketma-ketlikligi aniqlashdan iborat.
Genetik haritani tuzishda genetik markerlar joylashishining ketma-ketligi ma’lum zichlikdagi barcha xromosomalarning uzunligi bo’ylab, ya’ni bir-biridan juda yaqin masofada joylashgan turli polimorf DNK lokusi va DNK tarkibidagi irsiy o’zgarishlar orqali aniqlanadi.
Inson genomini haritalash.1990-yildan 2003-yilgacha inson genomi dasturi o’zining genetik va fizik haritalari asosida inson genomi haqida to’liq tasavvur hosil qildi. Markerli ketma-ketliklarning genetik haritasi barcha inson genlarini, ayniqsa, irsiy kasalliklar genlarini haritalashni osonlashtirish uchun mo’ljallangan bo’lib, bu dasturning asosiy maqsadlaridan biri bo’lib hisoblangan. Uni amalga oshirish davomida bir necha ming gen nisbatan qisqa vaqt ichida genetik haritaga tushirilgan.
Inson genetik haritalari hozirgi kunda og’ir irsiy kasalliklarga tashxis qo’yishda tibbiyotda ishlatiladi.
Qisqa ketma-ketlik algoritmi (qisqa ketma-ketliklarni haritalash) — genomning aniq qisqa ketma-ketliklarni aniqlash ehtimolini yoki transkriptomdagi pozitsiyalariga mos kelishini aniqlashdan iborat bo’lgan ikkinchi avlod tartiblash natijalarini tahlil qilish uchun qo’llaniladigan bioinformatik usul hisoblanadi. Bu, odatda, o’rganilayotgan organizm genomi ma’lum bo’lsa, ma’lumotlarni qayta ishlashning birinchi bosqichidir.
Usuli.Keyingi avlod platformalarturiqisqa50-500 nukleotid juft uzunligiga ega bo’lgan millionlab namunalar olish kabi samarali tartiblash imkonini beradi. Buning uchun DNK yoki kDNK molekulasi ko’plab qisqa segmentlarga bo’linib, ular parallel ravishda tartiblanadi. Bu qisqa segmentlarning ketma-ketliklarini olgandan so’ng ulardan to’liq genom yoki kDNK ketma-ketliklar to’plamini tiklash kerak. Buning uchun, aniqlanganhar bir qisqa ketma ketliklarning genomdagi ketma-ketliklarga mos keladigan eng munosib ketma-ketliklarningo’rnini aniqlash kerak bo’ladi.
Noma’lum genom ketma-ketliklarini aniqlashda, genomi aniqlangan organizm denovo sharoitida genomni rekonstruksiya qilish ishlari olib borilgan, hozirda esa genom ketma-ketliklarining tahrirlash ishlari bo’yicha ko’plab xalqaro loyihalar faoliyat olib bormoqdalar. Bularga genomning ketma-ketliklari to’plamlari misol bo’la oladi, bunday holatlarda ketma-ketliklarni o’qishga ularning ma’nosini aniqlash uchun ma’lumotlar bazasidagi holati o’rganiladi. Bu jarayon haritalash deyiladi. Haritalash ishlarini olib borishda, turlicha yondoshuvlar ishlatiladi, masalan, genomni haritalash uchun katta bo’shliqlar yo’q bo’lishi kerak, RNK-sekvenirlash uslubi qo’llanilganda, ketma-ketliklar o’rtasida ajralishlar mavjudligi tufayli keng qo’llaniladi. Umuman, haritalash ishlarini o’tkazishda sekvenirlash uslubini qo’llash davom etmoqda va oxirgi avlod sekvenirlash uslublari uchun o’zgargani yo’q, lekin oldingi avlod sekvenirlash uslublari uchun ishlab chiqilgan dasturlar ko’p miqdordagi ma’lumotlar bilan ishlash uchun mo’ljallangan emas, shuning uchun, qisqa uzunliklarga ega bo’lgan ketma-ketliklarni o’qiydigan uslublar keng qo’llaniladi.
Do'stlaringiz bilan baham: |