Ketma-ketlikni tekislash va dinamik dasturlash
Ketma-ketlikni tekislash - ketma-ketlikda bir xil tartibda bo'lgan bir qator alohida belgilar yoki belgilar naqshlarini izlash orqali ikki yoki undan ortiq ketma-ketlikni solishtirishning standart usulidir. Bundan tashqari, bu o'xshashlik hududlarini aniqlash uchun ikki yoki undan ortiq belgilar ketma-ketligini tartibga solish usulidir.
Ketma-ketlikni moslashtirishning ahamiyati
Bimolekulyar ketma-ketlikda (DNK, RNK yoki oqsil) yuqori ketma-ketlik o'xshashligi odatda muhim funktsional yoki strukturaviy o'xshashlikni nazarda tutadi, bu ko'plab biologik tahlillarning birinchi bosqichidir. Bundan tashqari, ketma-ketlikni moslashtirish kasallik yoki kasallikka moyillikni keltirib chiqaradigan gen ketma-ketligini aniqlash, evolyutsiyani keltirib chiqaradigan genlar ketma-ketligidagi o'zgarishlarni aniqlash, umumiy ajdodni ko'rsatishi mumkin bo'lgan turli gen ketma-ketliklari o'rtasidagi munosabatni topish, funktsional jihatdan muhimligini aniqlash kabi muhim savollarni hal qilishi mumkin saytlar va mutatsiya hodisalarini namoyish qilish.
Hizalanishni tahlil qilish muhim ma'lumotlarni ochib berishi mumkin. Agar oqsillar o'xshash jarayonlarda ishtirok etsa, funktsiya uchun muhim bo'lishi mumkin bo'lgan ketma-ketlik qismlarini aniqlash mumkin. Tasodifiy mutatsiyalar oqsil ketma-ketligining muhim bo'lmagan qismlarida osonroq to'planishi mumkin. uning funktsiyasi. Ketma-ketlikning funktsiya uchun zarur bo'lgan qismlarida deyarli hech qanday mutatsiyalar qabul qilinmaydi, chunki bunday hududlardagi taxminan barcha o'zgarishlar funktsiyani yo'q qiladi. Bundan tashqari, ketma-ketlikni moslashtirish noma'lum oqsillarga funktsiyani belgilash uchun muhimdir. Ikki qoldiqning oqsil moslashuvi, bu qoldiqlar ikki xil oqsilda o'xshash rollarni bajarishini anglatadi.
Ketma-ketlikni tekislash usullarining asosiy maqsadi o'xshashlikning maksimal darajasini va minimal evolyutsion masofani topishdir. Umuman olganda, ketma-ketlikni tekislash muammolarini hal qilish uchun hisoblash yondashuvlarini ikki toifaga bo'lish mumkin: global tekislash va mahalliy tekislash. Global hizalamalar barcha so'rovlar ketma-ketligining butun uzunligini kesib o'tadi va iloji boricha ko'proq belgilarni oxiridan oxirigacha moslashtiradi. Ushbu hizalama usullari ketma-ketliklar taxminan bir xil o'lchamga ega bo'lsa yoki ular o'xshash bo'lsa foydali bo'ladi. Mumkin bo'lgan eng yaxshi hizalanishni aniqlash uchun tekislash ketma-ketlikning boshidan oxirigacha amalga oshiriladi. Boshqa tomondan, mahalliy moslashuvlar o'xshashlik darajasi yuqori bo'lgan mahalliy hududlarni topadi. Ular kattaroq ketma-ketlik kontekstida o'xshashlik hududlarini o'z ichiga olgan deb gumon qilingan ketma-ketliklar uchun foydaliroqdir.
Bundan tashqari, ikkita ketma-ketlik o'rtasidagi o'xshashlik hududlarini topish uchun juftlik ketma-ketligini tekislash qo'llaniladi. Ketma-ketliklar soni ortib borayotganligi sababli, har bir ketma-ketlikni bir-biri bilan taqqoslash imkonsiz bo'lishi mumkin. Shunday qilib, bizga bir nechta ketma-ketlikni moslashtirish kerak, bunda barcha o'xshash ketma-ketliklarni bitta rasm yoki jadvalda solishtirish mumkin. Asosiy g'oya shundan iboratki, ketma-ketliklar bir-birining ustiga tekislanadi, shuning uchun koordinata tizimi o'rnatiladi, bu yerda har bir satr bitta oqsil uchun ketma-ketlikdir va har bir ustun har bir ketma-ketlikda bir xil pozitsiyada bo'ladi.
Ketma-ketlikni tekislashni amalga oshirish uchun turli xil yondashuvlar va usullarni amalga oshirish mavjud. Bularga dinamik dasturlash, evristik algoritmlar (BLAST va FASTA o'xshashligini qidirish), ehtimollik usullari, nuqta-matritsa usullari, progressiv usullar, ClustalW, MUSCLE, T-Coffee va DIALIGN kabi texnikalar kiradi.
Dinamik dasturlash (DP) - bu muammolar sinfi uchun muammolarni hal qilish usuli bo'lib, ularni oddiyroq kichik muammolarga bo'lish orqali hal qilish mumkin. U moslik va nomuvofiqliklar uchun ba'zi ballarni berish orqali tekislashni topadi (Skorlash matritsalari). Bu usul ketma-ketlikni tekislash masalalarida keng qo'llaniladi. Biroq, ketma-ketliklar soni ikkidan ortiq bo'lsa, ko'p o'lchovli Dinamik dasturlash katta saqlash va hisoblash murakkabligi tufayli amalga oshirilmaydi.
Dinamik dasturlash algoritmlari biologik ma'noni oshirish uchun bo'shliq jazolaridan foydalanadi. Chiziqli bo'shliq, doimiy bo'shliq, bo'shliqni ochish va bo'shliqni kengaytirish kabi turli xil bo'shliq jazolari mavjud. Bo'shliq ball qo'shish yoki o'chirish mavjud bo'lganda hizalanish uchun beriladigan jazodir. Evolyutsiya davomida ketma-ketlik bo'ylab uzluksiz bo'shliqlar mavjud bo'lgan holatlar bo'lishi mumkin, shuning uchun chiziqli bo'shliq jazosi tekislash uchun mos kelmaydi. Shu sababli, uzluksiz bo'shliqlar mavjud bo'lganda, bo'shliqni ochish jazosi va bo'shliqni uzaytirish jazosi joriy etildi. Bo'shliqni ochish jazosi bo'shliqning boshida qo'llaniladi, so'ngra undan keyingi boshqa bo'shliq ochiq penaltiga nisbatan kamroq bo'lgan bo'shliqni uzaytirish jazosi bilan beriladi. Turli xil bo'shliq jazo funktsiyalari turli dinamik dasturlash algoritmlarini talab qiladi. Shuningdek, ballarni tenglashtirish uchun almashtirish matritsasi mavjud. Ketma-ketlikni tekislash uchun asosan ishlatiladigan oldindan belgilangan skorlama matritsalari PAM (Point Accepted Mutation) va BLOSUM (Bloklarni almashtirish matritsasi).
Ikki algoritm, Smit-Waterman mahalliy hizalama uchun va Needleman-Wunsch global alignment uchun, dinamik dasturlash asoslangan.
Needleman-Wunsch algoritmi bir juft qoldiqning teng yoki noldan ko'p bo'lishi uchun tekislash ballini talab qiladi. Bo'shliq jazosi talab qilinmaydi va yo'lning ikkita katakchasi o'rtasida ball kamayishi mumkin emas. Smit-Uoterman samarali ishlashi uchun penalti talab qiladi. Qoldiqlarni tekislash ko'rsatkichi ijobiy yoki salbiy bo'lishi mumkin. Ballar yo'lning ikki xujayrasi o'rtasida o'sishi, kamayishi yoki darajasida qolishi mumkin.
Do'stlaringiz bilan baham: |