Hisoblash
Hizalamalar Hewlett-Packard (HP) AlphaServer GS1280 tizimida, bitta 1,15 gigagertsli protsessor yordamida amalga oshirildi.
BLAT, MegaBLAST va SSAHA onlayn algoritmlarining mahalliy versiyalari mos ravishda UCSC, NCBI va Ensembldagi genom brauzerining veb-saytlaridan olingan. Eng so'nggi versiyalar tanlangan, BLAT 26-versiyasi (2004 yil fevral) bundan mustasno, u BayGenomics ketma-ketlik teglarini lokalizatsiya qilish uchun ishlatiladigan versiya bo'lgani uchun tanlangan. SSAHA 3.1 versiyasi va MegaBLAST 2.2.10 versiyalari 2005 yil iyul oyida mavjud bo'lgan eng so'nggi nashrlarni ifodalaydi. Onlayn mahalliylashtirish jarayonini taxminiylashtirish uchun parametrlar onlayn dasturlarda qo'llaniladigan standart parametrlarga mos keladigan qilib o'rnatildi. Uchta dastur bir xil turdagi parametrlarni baham ko'rmaydi, ammo parametrlar bir xil yoki o'xshash bo'lsa, ularga tayinlangan qiymatlar bir xil bo'lishi shart emas. Ushbu tadqiqotda standart "so'z uzunligi" alohida ahamiyatga ega, ya'ni, indekslangan genom fragmentlarining uzunligi. So'z uzunligining qisqarishi qisqa, ammo haqiqiy mosliklarni aniqlash qobiliyatini oshiradi, lekin noto'g'ri mosliklar sonini ham oshiradi. So'z uzunligi SSAHA uchun 10 nukleotidga va BLAT uchun 11 nukleotidga o'rnatildi, gugurtni ekish uchun kamida ikkita qo'shni "so'z" kerak. Xuddi shunday, MegaBLAST moslashtirishni yaratish uchun kamida 28 ta qo'shni moslikni talab qiladi. Har bir algoritm takroriy niqoblash bilan qanday shug'ullanishi ham muhimdir. Algoritmlarning birortasi ham niqoblangan hududlarda hizalanmaydi, lekin BLAT va MegaBLAST moslamalarni RepeatMasker algoritmi tomonidan maskalangan hududlarga kengaytirish imkonini beradigan tarzda o‘rnatilishi mumkin. Odatiy bo'lib BLAT bunday tekislash kengaytmalariga ruxsat berish uchun o'rnatiladi, lekin MegaBLAST ruxsat bermaydi, natijada rasmda keltirilgan tekislashlar o'rtasidagi farqlar turiga olib keladi. So'z uzunligining qisqarishi qisqa, ammo haqiqiy mosliklarni aniqlash qobiliyatini oshiradi, lekin noto'g'ri mosliklar sonini ham oshiradi. So'z uzunligi SSAHA uchun 10 nukleotidga va BLAT uchun 11 nukleotidga o'rnatildi, gugurtni ekish uchun kamida ikkita qo'shni "so'z" kerak. Xuddi shunday, MegaBLAST moslashtirishni yaratish uchun kamida 28 ta qo'shni moslikni talab qiladi. Har bir algoritm takroriy niqoblash bilan qanday shug'ullanishi ham muhimdir. Algoritmlarning birortasi ham niqoblangan hududlarda hizalanmaydi, lekin BLAT va MegaBLAST moslamalarni RepeatMasker algoritmi tomonidan maskalangan hududlarga kengaytirish imkonini beradigan tarzda o‘rnatilishi mumkin. Odatiy bo'lib BLAT bunday tekislash kengaytmalariga ruxsat berish uchun o'rnatiladi, lekin MegaBLAST ruxsat bermaydi, natijada rasmda keltirilgan tekislashlar o'rtasidagi farqlar turiga olib keladi. So'z uzunligining qisqarishi qisqa, ammo haqiqiy mosliklarni aniqlash qobiliyatini oshiradi, lekin noto'g'ri mosliklar sonini ham oshiradi. So'z uzunligi SSAHA uchun 10 nukleotidga va BLAT uchun 11 nukleotidga o'rnatildi, gugurtni ekish uchun kamida ikkita qo'shni "so'z" kerak. Xuddi shunday, MegaBLAST moslashtirishni yaratish uchun kamida 28 ta qo'shni moslikni talab qiladi. Har bir algoritm takroriy niqoblash bilan qanday shug'ullanishi ham muhimdir. Algoritmlarning birortasi ham niqoblangan hududlarda hizalanmaydi, lekin BLAT va MegaBLAST moslamalarni RepeatMasker algoritmi tomonidan maskalangan hududlarga kengaytirish imkonini beradigan tarzda o‘rnatilishi mumkin. Odatiy bo'lib BLAT bunday tekislash kengaytmalariga ruxsat berish uchun o'rnatiladi, lekin MegaBLAST ruxsat bermaydi, natijada rasmda keltirilgan tekislashlar o'rtasidagi farqlar turiga olib keladi. balki xato o'yinlar sonini ham oshiradi. So'z uzunligi SSAHA uchun 10 nukleotidga va BLAT uchun 11 nukleotidga o'rnatildi, gugurtni ekish uchun kamida ikkita qo'shni "so'z" kerak. Xuddi shunday, MegaBLAST moslashtirishni yaratish uchun kamida 28 ta qo'shni moslikni talab qiladi. Har bir algoritm takroriy niqoblash bilan qanday shug'ullanishi ham muhimdir. Algoritmlarning birortasi ham niqoblangan hududlarda hizalanmaydi, lekin BLAT va MegaBLAST moslamalarni RepeatMasker algoritmi tomonidan maskalangan hududlarga kengaytirish imkonini beradigan tarzda o‘rnatilishi mumkin. Odatiy bo'lib BLAT bunday tekislash kengaytmalariga ruxsat berish uchun o'rnatiladi, lekin MegaBLAST ruxsat bermaydi, natijada rasmda keltirilgan tekislashlar o'rtasidagi farqlar turiga olib keladi. balki xato o'yinlar sonini ham oshiradi. So'z uzunligi SSAHA uchun 10 nukleotidga va BLAT uchun 11 nukleotidga o'rnatildi, gugurtni ekish uchun kamida ikkita qo'shni "so'z" kerak. Xuddi shunday, MegaBLAST moslashtirishni yaratish uchun kamida 28 ta qo'shni moslikni talab qiladi. Har bir algoritm takroriy niqoblash bilan qanday shug'ullanishi ham muhimdir. Algoritmlarning birortasi ham niqoblangan hududlarda hizalanmaydi, lekin BLAT va MegaBLAST moslamalarni RepeatMasker algoritmi tomonidan maskalangan hududlarga kengaytirish imkonini beradigan tarzda o‘rnatilishi mumkin. Odatiy bo'lib BLAT bunday tekislash kengaytmalariga ruxsat berish uchun o'rnatiladi, lekin MegaBLAST ruxsat bermaydi, natijada rasmda keltirilgan tekislashlar o'rtasidagi farqlar turiga olib keladi. lekin BLAT va MegaBLAST moslamalarni RepeatMasker algoritmi tomonidan maskalangan hududlarga kengaytirishga ruxsat berish uchun sozlanishi mumkin. Odatiy bo'lib BLAT bunday tekislash kengaytmalariga ruxsat berish uchun o'rnatiladi, lekin MegaBLAST ruxsat bermaydi, natijada rasmda keltirilgan tekislashlar o'rtasidagi farqlar turiga olib keladi. lekin BLAT va MegaBLAST moslamalarni RepeatMasker algoritmi tomonidan maskalangan hududlarga kengaytirishga ruxsat berish uchun sozlanishi mumkin. Odatiy bo'lib BLAT bunday tekislash kengaytmalariga ruxsat berish uchun o'rnatiladi, lekin MegaBLAST ruxsat bermaydi, natijada rasmda keltirilgan tekislashlar o'rtasidagi farqlar turiga olib keladi.3B . [ har bir dastur uchun ishlatiladigan parametrlarning toʻliq roʻyxati uchun 4-Qoʻshimcha faylga qarang.]
Taqqoslash algoritmi mahalliylashtirish dasturlarining aniqligini biologik so'rov uchun mos bo'lgan granularlikning uchta darajasida ko'rsatish uchun ishlab chiqilgan: gen, ekzon va nukleotid. Gen darajasida, dastur tomonidan bildirilgan lokalizatsiya va gen uchun ma'lum koordinata o'rtasidagi har qanday o'xshashlik, hatto bitta nukleotiddan iborat bo'lsa ham, haqiqiy ijobiy deb hisoblanadi. Xuddi shunday, har bir ekson uchun haqiqiy musbat uchun faqat bitta nukleotid mos kelishi kerak edi. Nukleotidlar darajasida faqat bitta nukleotid pozitsiyasidagi aniq moslik haqiqiy ijobiy deb hisoblanadi. Shunday qilib, granularlikning har bir darajasi ushbu tahlilda boshqa qat'iylikni qo'yadi. Natijalar har bir algoritm uchun eslab qolish va aniqlik ballari bilan ifodalanadi.
Ma'lumotnomalar
1. Stenford WL, Kon JB, Kordes SP: Gen-tuzoq mutagenezi: o'tmish, hozirgi va undan keyin. Nat Rev Genet. 2001, 2: 756-768. 10.1038/35093548.
PubMed CAS Maqola Google olimi
2. Altschul SF, Gish V, Miller V, Myers EW, Lipman DJ: Asosiy mahalliy moslashtirish qidiruvi vositasi. J Mol Biol. 1990, 215: 403-410. 10.1006/jmbi.1990.9999.
PubMed CAS Maqola Google olimi
3. Stryke D, Kawamoto M, Huang CC, Johns SJ, King LA, Harper CA, Meng EC, Li RE, Yee A, L'Italien L, Chuang PT, Young SG, Skarnes WC, Babbitt PC, Ferrin TE: BayGenomics: a Sichqonchaning embrion ildiz hujayralarida insertsional mutatsiyalar manbai. Nuklein kislotalari Res. 2003, 31: 278-281. 10.1093/nar/gkg064.
PubMed CAS PubMed Central Maqola Google olimi
4. Nord AS, Chang PJ, Conklin BR, Cox AV, Harper CA, Hicks GG, Huang CC, Jons SJ, Kawamoto M, Liu S, Meng EC, Morris JH, Rossant J, Ruiz P, Skarnes WC, Soriano P, Stenford WL , Stryke D, von Melchner H, Wurst W, Yamamura K, Young SG, Babbitt PC, Ferrin TE: The International Gen Trap Consortium veb-sayti: sichqonchadagi barcha ochiq gen tuzoqlari hujayralari uchun portal. Nuklein kislotalari Res. 2006, 34: D642-8. 10.1093/nar/gkj097.
PubMed CAS PubMed Central Maqola Google olimi
5. Skarnes WC, von Melchner H, Wurst W, Hicks G, Nord AS, Cox T, Young SG, Ruiz P, Soriano P, Tessier-Lavigne M, Conklin BR, Stanford WL, Rossant J: Sichqonchaning ishlashi uchun umumiy gen tuzoqlari manbasi genomika. Nat Genet. 2004, 36: 543-544. 10.1038/ng0604-543.
PubMed CAS PubMed Central Maqola Google olimi
6. Townley DJ, Avery BJ, Rosen B, Skarnes WC: Sichqonlarda qo'shimcha mutatsiyalar manbasini yaratish uchun gen tuzoqlari integratsiyasining tezkor ketma-ketligini tahlil qilish. Genom Res. 1997, 7: 293-298.
PubMed CAS Maqola Google olimi
7. Ewing B, Hillier L, Wendl MC, Green P: phred yordamida avtomatlashtirilgan sekvenser izlarining asosiy chaqiruvi. I. Aniqlikni baholash. Genom Res. 1998, 8: 175-185.
PubMed CAS Maqola Google olimi
8. Chen D, Patton JT: Teskari transkriptaza 5'-RACE va primer kengaytmasi vaqtida cDNAlarga shablonlanmagan nukleotidlarni qo'shadi. Biotexnika. 2001, 30: 574-80, 582.
PubMed CAS Google olimi
9. Wiles MV, Vauti F, Otte J, Fuchtbauer EM, Ruiz P, Fuchtbauer A, Arnold HH, Lehrach H, Metz T, von Melchner H, Wurst W: embrion poyasidan mutant sichqonlarni yaratish uchun gen-tuzoq ketma-ketligi teglar kutubxonasini yaratish hujayralar. Nat Genet. 2000, 24: 13-14. 10.1038/71622.
PubMed CAS Maqola Google olimi
10. Chjan Z, Shvarts S, Vagner L, Miller V: DNK ketma-ketligini tekislash uchun ochko'z algoritm. J Comput Biol. 2000, 7: 203-214. 10.1089/10665270050081478.
PubMed CAS Maqola Google olimi
Do'stlaringiz bilan baham: |