Natijalar va muhokama Natijalarimiz tekshirilgan uchta granülerlik darajasi, gen, ekzon va nukleotidning har birida eslab qolish va aniqlik bo'yicha lokalizatsiya ishlashidagi farqlarni ko'rsatadi ( 1 -rasm ). Qayta tiklash balli aniqlangan haqiqiy ijobiy holatlarning foizini ko'rsatadi. Aniqlik haqiqiy ijobiylarga mos keladigan xabar qilingan moslik foizini ko'rsatadi.
1-rasm. Har bir lokalizatsiya algoritmi uchun eslab qolish va aniqlik. SSAHA natijalari qizil rangda, MegaBLAST ko'k rangda va BLAT yashil rangda ko'rsatilgan. Birinchi ustun to'liq uzunlikdagi gen so'rovlari ketma-ketligi bilan olingan qayta chaqirishni ifodalaydi. Ikkinchi ustunda ketma-ketlik yorlig'i so'rovlari bilan olingan chaqiruv ko'rsatilgan. Uchinchi va to'rtinchi ustunlar mos ravishda to'liq uzunlikdagi genlar va ketma-ketlik teglarini lokalizatsiya qilish uchun foydalanilganda har bir algoritmning aniqligini ko'rsatadi. (A) Algoritm bo'yicha lokalizatsiyalar to'plami va genni o'z ichiga olgan genom mintaqasi o'rtasidagi kamida bitta nukleotidning bir-biriga mos kelishi bilan o'lchanadigan gen darajasida eslab qolish va aniqlik. Moviy chiziqlar faqat yuqori zarba hisobga olinganda erishilgan chaqiruv va aniqlikni bildiradi. (B) Eksonni eslab qolish va aniqlik, bu eksonning ma'lum lokalizatsiyasi va o'yin o'rtasidagi kamida bitta nukleotidning bir-biriga mos kelishi bilan o'lchanadi. Ketma-ket teglar to'liq uzunlikdagi genlarga qaraganda qisqaroq va shuning uchun odatda har qanday genning bir nechta eksonlariga mos keladigan etarli ketma-ketlik ma'lumotlarini o'z ichiga oladi, bu esa ekson va nukleotid darajalarida kam eslab qolishga olib keladi. Bu mahalliylashtirish dasturlari muvaffaqiyatsizligini bildirmaydi. (C) Nukleotidlarni eslab qolish va aniqlik, genning ma'lum lokalizatsiyasidagi nukleotid va so'rovlar ketma-ketligi lokalizatsiyasidagi nukleotid o'rtasidagi moslik bilan o'lchanadi.
To'g'ri genga lokalizatsiya Eslatib o'tamiz, bizning tadqiqotimiz shuni ko'rsatadiki, genom bilan bog'liq ma'lumotlar bilan ketma-ketlikni bog'lashni xohlaydigan tadqiqotchilar ushbu tadqiqotda ko'rib chiqilgan uchta lokalizatsiya dasturidan ishonchli foydalanishlari mumkin. SSAHA, MegaBLAST va BLAT test to'plamidagi 1659 ta to'liq uzunlikdagi genlarning har birini mos keladigan genning ma'lum koordinatalariga to'liq yoki qisman mos keladigan genomik hududga muvaffaqiyatli lokalizatsiya qiladi ( 1A -rasm ). Ketma-ket teglar deyarli bir xil narxga ega, barcha dasturlar ushbu tadqiqotda foydalanilgan 3369 ta ketma-ketlik teglarining 98% uchun genomning to'g'ri mintaqasida lokalizatsiya haqida xabar beradi.
Genomning takroriy niqoblanishi ketma-ketlik teglarini to'g'ri genlarga lokalizatsiya qilishdagi kam sonli muvaffaqiyatsizliklarning ko'p qismini tashkil qiladi. Onlayn lokalizatsiya sukut bo'yicha niqoblangan genomik ketma-ketlikka qarshi amalga oshiriladi, chunki bu natijalar tezda qaytarilishini ta'minlaydi va genomning 50% ga yaqini takroriy elementlardan iborat bo'lishiga qaramay, nisbatan kam to'g'ri lokalizatsiya o'tkazib yuboriladi [ 17 ]]. Ushbu tadqiqotda, test to'plamidagi ketma-ketlik teglarining 2% dan kamrog'i bir yoki bir nechta dastur bilan mahalliylashtirish natijalarini qaytarmadi, chunki ular maskalash orqali olib tashlangan hududlar bilan to'liq yoki qisman bir-biriga mos keladi. Bundan tashqari, takroriy hududlar uchun lokalizatsiya qilingan beshta ketma-ketlik teglari har bir dastur tomonidan talab qilinadigan minimal balldan oshib ketadigan xato mosliklarga ega va shuning uchun noto'g'ri lokalizatsiya qilingan. Aksincha, genomning niqoblanmagan versiyasidan foydalanish ketma-ketlik belgilarining test to'plamini 100% eslab qolishga olib keladi, ammo noto'g'ri lokalizatsiya sonini o'n barobarga oshiradi. Bundan tashqari, genomning niqoblanmagan versiyasidan foydalanish hisoblash vaqtini sezilarli darajada oshiradi ( 1- jadval ).