attgtACcTCgTgG-AA---- -----AC-TCaTaGcAAccag Bunda ikki ketma-ketlik shunday solishtirilishi kerakki, tasodiflar soni maksimal qiymatga erishsin (juftlab taqqoslash (tekislash)). Tekislashtirishning sifati mos kelmagan harflar va probellar uchun (ko’proq mos keluvchi ketma-ketliklarga ega bo’lish uchun ba’zan ketma-ketliklar surilganida bo’sh joylar qoladi) jarima belgilash orqali aniqlanadi.
Shu tariqa, ketma-ketlik sekvenirlanganidan keyin ma’lumotlar bazasidan unga o’xshash ketma-ketliklar qidirilib, uning vazifasi haqida birlamchi ma’lumot olish imkonini beradi.Agar ikkita xarf o’zoro mos kelsa, demak bu soxa funksional muxim xisoblanadi.Aminokislotalar almashinuvi oqsil xossalariga ta’sir ko’rsatmasligi yoki butkul o’zgartirib yuborishi mumkin. Masalan, lizin aminokislotasi leytsin bilan almashib qolsa, mazkur oqsilning vazoviy strukturasi va xossalari butkul o’zgarib ketishi mumkin. Lizinning arginin bilan almashinishi esa deyarli hech qanday o’zgarishlarga sabab bo’lmaydi.Shuning uchun aminokislota ketma-ketliklari taqqoslanayotganida aminokislota qoldiqlarini qarshi qo’yish matritsasi ham inobatga olinadi (o’xshash, bir oz o’xshash, o’xshamaydigan).Ikkita ketma-ketliknitekislashtirish –ularni yonma-yon qo’yib, ular orasidagi probellar shunday qo’yiladiki, bunda ularning umumiy uzunligi bir hil bo’lishi kerak.
Ketma-ketliklarni bu tarzda taqqoslash molekulyar biologiyada keng tarqalgan.Tekislashtirish evolyutsion jarayonni aks ettiradi deb taxmin qilinadi.Bir-birini ostida turuvchi ketma-ketliklar ajdod-ketma-ketlik ramziga mos keladi.Ketma-ketliklar evolyutsiyasi qanday yo’nalishda borganligini aniq aytib bera olmaymiz. Shuning uchun, “to’g’ri” ketma-ketlik tariqasida sifat vazifalari bo’yicha nisbatan optimal tekisliklar olinadi. Ammo, ushbu tanlangan vazifaning haqiqatdan ham to’g’ri ekanligini qanday nazorat qilish mumkin, nisbatan yaqin bo’lgan etalonlar bormi? Etalon tariqasida ularning fazoviy strukturasini o’rnini nisbatan to’laroq to’ldirishga mos keluvchi tekisliklar olinishi mumkin (bunday strukturalar bir necha yuz oqsillar uchun aniqlangan). Bu oqsilning hujayrada biror bir vazifani amalga oshirishi uning fazoviy strukturasiga bog’liq ekanligi bilan aniqlanadi, uchlamchi struktura asosida yotuvchi aminokislota esa ajdod oqsilning aynan o’sha aminokislotalariga mos keladi. Ketma-ketliklar “biologik tahlilga” qadar tahlil etilganida (masalan birorta fayl taqqoslanganda) masofani taxrir qilish atamasidan foydalaniladi. Bunda taxrir qiluvchi amallar ketma-ketligi qayd etiladi (masalan ramzni o’zgartirish, joylashtirish yoki olib tashlash) va har bir amal ushun ma’lum narx belgilanadi. Shu tariqa har bir tekislashtirish o’z narxiga ega bo’lib, aloxida amallar summasining bahosi kabi aniqlanadi.Eng kam narxga ega bo’lgan ketma-ketlik eng yaxshisi xisoblanadi.
Biologik ketma-ketliklarni tekislashtirishda yuqoridagi sxemaga o’zgartirishlar kiritish kerakligi aniqlandi.Chunki, turli aminokislotalar bir biridan turli belgilari bilan farq qiladi. Masalan, alanin va valin bir biriga juda o’xshash bo’lgani uchun ularni almashinish baxosi u qadar katta bo’lmaydi. Triptofan esa kam uchrovchi aminokislota bo’lganligi uchun ikkita triptofanni qarama-qarshi qo’yish yuqori baholanadi. Shuning uchun bioinformatikada oqsillar solishtirilganida “ramzning o’zgartirish bahosi”ning o’rniga ozgarishlarning og’irlik matritsasidan foydalaniladi. Bunda har bir juft harfga ma’lum og’irlik belgilanadi (o’xshash bo’lsa –musbat”+”, farqlansa –manfiy”-“) . Umumiy xolda tekislanishlar esa W=R-G kabi yoziladi. Bunda R-qarama-qarshi qo’yilgan ramzlarning summaviy og’irligi (tanlab olingan almashinishlar matritsasi og’irligiga mos ravishda), G –ramzlarni olib tashlagan yo keltirib qo’yilganligi uchun jarimalar summasi. Demak, optimal tekislashtirish – nisbatan katta og’irlikka ega bo’lgan tekislashtirishdir. Masalan, unliharflarmoskelishog’irligi +2, undosh xarflarning mos kelishi +1, ikkita xar hil undosh yoki unlini qarama qarshi qo’yish -1, unli va undoshni qarama –qarshi qo’yish og’irligi -2, Biror belgini joylashtirish yoki olib tashlash uchun jarima -5 bo’lsin. Bunda istalgan ikkita so’zni taqqoslab, uni og’irligini chiqarishimiz mumkin boladi.Bahoni minimallashtirib, sifatni maksimallashtirish –bu texnik nayrang emas. Sifatni maksimallashtirish tilida optimal lokal o’xshashlikni topish vazifasi qo’yiladi. Bu evolyutsiya jarayonida o’zgarib ketgan, faqat kichik uchastkalarigina o’xshash bo’lgan, ikkita oqsilni o’zoro taqqoslashga mos keladi.
Optimal tekislashtirish algoritmi Richard Belman tomonidan 1957 yilda amaliyotga tadqiq etilgan dinamik dasturlashtirish usuliga asoslangan. Usulning asosiy g’oyasi quyidagilardan iborat: asosiy vazifani xal etish uchun bir nechta oraliq formalarni o’ylab topish va ketma-ketlik bilan ularni xal qilish kerak (ketma-ketlik tartibi –bu alohida savol). Bunda navbatdagi savol undan oldin yechilgan masala javobidan kelib chiqqan xolda oson yechilishi kerak.Bir qator oraliq masalalarni orientirlangan atsiklik graf ko’rinishida namoyon etish qulaydir.Uning yuqori qismi oraliq vazifalarga mos keladi, Qovurg’a qismi esa qaysi oraliq masalalarning natijalari asos sifatida qo’llanilishini ko’rsatadi. Shu tariqa dastlabki vazifa grafdagi optimal yo’lni topishga olib boradi.
Optimal tekislashtirish tuzilganida oraliq vazifa -dastlabki ketma-ketlikning boshlang’ich fragmentlarining optimal tekislanishlarini tuzish xisoblanadi. Bunda masalani fragment uzunligi ortish ketma-ketligida xal etish kerak. «ПАПКА» va «ПАПАХА» so’zlarini oraliq yechimlari orasidagi bog’liqlik hamda optimal tekislashtirishga olib keluvchi oraliq qadamlar ketma-ketligi quyidagi rasmda keltirilgan.
(a) PAPKAvaPAPAXAso’bog’liqlikgrafi. Xarbirtepalikberilgan so’z boshlang’ich fragmentlariga mos keladi. Tepalik tarkibiga kiruvchi diagonal qovurg’a solishtirilayotgan boshlang’ich fragment oxirgi xarflarini qarama-qarshi qo’yishga mos keladi (1-xolat), gorizontal qovurg’a-PAPAXA so’zidagi harflarni o’chirish, vertical qovurg’a –PAPKA so’zidagi harflarnni o’chirishga mos keladi. (2 va 3 xolatlar). O’ng tomon tepadagi cho’qqi –boshlang’ich bo’lib, bo’sh so’zlarni taqqoslashga mos keladi, chap tomondagi pastki burchak – to’liq PAPKAvaPAPAXA so’zlarining tekislanishlarini aks ettiradi
(c) Optimal tekislanishlarga mos keluvchi treaktoriya. Kataklarichidaoraliq optimal tenglashtirishlar og’irligi keltirilgan. Masalan, PAP va PAPA uchun optimal tekislanishlar og’irligi 0 ga teng. PAPKvaPAPAXuchunesa 1 gateng.
Amaliy nuqtai nazardan tadqiq etilayotgan ketma-ketlikka mos ketma-ketliklarni ma’lumotlar bazasidan izlab toppish eng muxim xisoblanadi. Oqsillarning fazoviy strukturasini tahmin etishda ketma-ketlikni struktura bilan tekislashtirish algoritmlari muxim o’rin egallaydi (bunda aminokislotalarning turli hil fizik-kimyoviy hossalarga ega bo’lganliklari uchun oqsil yuzasida turlicha stotalarda uchraydi).