2.4 Proteinlar o'zaro ta'sir tarmoqlarida shovqinni boshqarish
Protein-oqsil o'zaro ta'sirini (PPI) tarmoq sifatida ko'rsatish mumkin, bu ularni o'rganish uchun grafik nazariyasidan foydalanishga imkon beradi. Tarmoq topologiyasini o'rganish ma'lum organizmlar bilan bog'liq naqshlarni ochib berishi mumkin. Bu erda biz PPI tarmoqlarini ajratish va etishmayotgan havolalarni bashorat qilishning yangi metodologiyasini taklif qilamiz, faqat tarmoq topologiyasi, tashkilotni o'lchash (OM) usuli. OM metodologiyasi ikkita PPI tarmog'ini denoizingda qo'llanilgan Saccharomyces cerevisiae ma'lumotlar to'plamlari (Xamirturush va CS2007) va bittasi Homo sapiens ma'lumotlar to'plami (inson). OM metodologiyasining denoising imkoniyatlarini baholash uchun ikkita strategiya qo'llanilgan. Birinchi strategiya tasodifiy tarmoqlarda va mos yozuvlar tarmog'ida qo'llanilishini taqqoslagan bo'lsa, ikkinchi strategiya asta -sekin tasodifiy qo'shilish va qirralarning olib tashlanishi bilan tarmoqlarni bezovta qildi. OM metodologiyasini Xamirturush va Inson mos yozuvlar to'plamlariga qo'llash AUCga 0,95 va 0,87 ga, xamirturush va inson tarmoqlarida mos ravishda erishdi. Xamirturush va inson mos yozuvlar majmuasining 80% tasodifiy olib tashlanishi AUC 0,71 va 0,62 ga, 80% tasodifiy qo'shilish esa AUCga mos ravishda 0,75 va 0,72 ga olib keldi. OM metodologiyasini CS2007 ma'lumotlar bazasiga qo'llash AUCni 0,99 ga beradi. Biz, shuningdek, CS2007 ma'lumotlar bazasi tarmog'ini bezovta qilib, qirralarni oldindan tasvirlangan nisbatlarda tasodifiy qo'shib olib tashladik. Tarmoqdan aniqlangan va o'chirilgan soxta pozitsiyalar 97% dan, 20% ko'proq qirralarni qo'shganda, 80% ko'proq qirralar kiritilganda 89% gacha o'zgargan. Tarmoqqa aniqlangan va kiritilgan haqiqiy pozitivlar 80% qirralarning tasodifiy o'chirilishidan so'ng, qirralarning 20% ni olib tashlashda 95% dan 40% gacha o'zgargan. OM metodologiyasi biologik tarmoqlarning topologik tuzilishiga sezgir. Olingan natijalar shuni ko'rsatadiki, ushbu yondashuv PPI tarmoqlarini ajratishda samarali ishlatilishi mumkin.
Proteinlar har bir organizmda muhim rol o'ynaydi, chunki ular deyarli har bir hujayra funktsiyasi uchun zarurdir. Biroq, oqsillar o'z vazifalarini bajarish uchun bir -biri bilan o'zaro aloqada bo'lishi kerak. Shu sababli, agar ikkita oqsil o'rtasidagi fiziologik o'zaro ta'sir buzilgan bo'lsa, kasallik holatlari paydo bo'lishi mumkin [1].
Protein-oqsil o'zaro ta'siri (PPI) tarmoqlari yuqori biologik tarmoqlar to'plami bo'lib, o'ziga xos topologik xususiyatlarga ega, masalan, yuqori klasterlanish koeffitsienti, ierarxiyaning mavjudligi, heterojenlik va kuch-qonunga o'xshash darajadagi taqsimot [2]. Assotsiatsiya aybdorligi haqidagi gipoteza shuni ko'rsatadiki, ko'p interaktiv qo'shnilar bilan bo'lishadigan ikkita oqsil funktsional bir xillik va lokalizatsiya uyg'unligiga ega bo'lishi mumkin [3]. Bu xususiyatlar shuni ko'rsatadiki, faqat tarmoq topologiyasi PPI tarmog'ini ochish uchun maqbul variant bo'lishi mumkin. PPI tarmog'ini yo'q qilish o'zaro aloqalarni topishga va yo'qolgan o'zaro ta'sirlarni topishga mos keladi. Proteinlarning o'zaro ta'sirini aniqlash usullari aniq emas va organizmlar hali to'liq ma'lum emas, shuning uchun PPI tarmoqlarini organizmlarning aniqroq modellariga ega bo'lish uchun ajratish muhimdir.
Proteinlar o'zaro ta'sirini grafik sifatida ko'rsatish mumkin, bu ularni o'rganishda grafik nazariyasidan foydalanishga imkon beradi. Shunday qilib, biologik tarmoqlarni denoise qilishning turli usullari ishlab chiqildi ([4] da ko'rib chiqilgan). Bularga tajribalarni takrorlash [5, 6], oqsillar haqida oldingi bilimlardan foydalanish [7, 8], funktsional yoki tizimli izohlardan foydalanish [9-13] va ma'lum ma'lumotlar va tarmoq topologiyasiga asoslangan yondashuvlar asosida tuzilgan nazariy taqsimotlar bilan taqqoslash. - 18]. Bu erda taklif qilingan yondashuv ikkinchi toifaga kiradi.
Qavssiz semantik joylashtirish (NCSE) deb nomlangan yondashuv PPI tarmoqlarining geometrik taxminiga binoan evklidni o'rganishga urinayotgan PPI tarmog'idagi o'zaro ta'sirlarning ishonchliligini baholaydi [19] va u Xamirturushning uchta ma'lumotlar to'plamida sinovdan o'tkazildi. Saccharomyces cerevisiae. PPIlarning ishonchliligini baholash uchun mashinani o'rganishga asoslangan hisoblash usullari ham qo'llanilgan va u Xamirturush va Helicobacter pylori PPI ma'lumotlar to'plami [20, 21].
Yaqinda o'tkazilgan tadqiqotda Ly va boshq. [22] tizimli muvofiqlik indeksini va tizimli buzilish usulini (SPM) taklif qildi. Bir tomondan, tizimli muvofiqlik indeksi tarmoqni tashkil etilishini tushunmasdan, uning tashkiliy bog'liqligini oldindan bilishini aks ettirishi mumkin, bu tarmoqni tashkil etishning aniqligini baholashga va tarmoq evolyutsiyasidagi mexanik o'zgarishlarni nazorat qilishga imkon beradi. Boshqa tomondan, SPM tarmoqdagi qirralarning foizini olib tashlash orqali havolalarni bashorat qiladi va shu bilan qolgan tarmoqni shu foizga buzadi. Bu mustaqil tarmoq buzilishlari orasidagi kuchli korrelyatsiyaga asoslanadi, bu shuni ko'rsatadiki, yo'qolgan qirralarni, ya'ni noto'g'ri salbiy (FN) o'zaro ta'sirlarni aniqlangan o'zaro ta'sirlarning qo'shimcha to'plami, ya'ni haqiqiy musbat (TP) bilan to'sib qo'yish orqali aniqlash mumkin. o'zaro ta'sirlar.
Luo va boshqalar. [4] tarmoq orqali topologiyaga asoslangan yondashuvning ishlashi, odatda, kam tarmoq ma'lumotlarini ishlatganda yomonlashadi, siyrak yuqori o'tkazuvchanlik skriningi (HTS) bo'yicha interatomik xaritalashni oqsillararo xaritalashni amalga oshirish uchun birgalikda filtrlashga asoslangan topologiyaga asoslangan (CFT) usulini taklif qildi. Bu yondashuv atomlararo xaritaning yechim maydoni va shaxsiy tavsiyalarning echimlar maydoni o'xshash degan tushunchaga asoslangan. Har bir protein tarmoqdagi o'zaro ta'sirini tavsiflovchi xususiyat vektori sifatida tasvirlangan. Bunga qo'shimcha ravishda, funktsional vektor PPI-larni modellashtirish uchun mahallalararo o'xshashlikni (I-Sim) yaratib, funktsional o'xshashlik og'irligi orqali o'zaro ta'sirlarni ifodalovchi mos keladigan o'xshashlik vektorini hisoblash uchun ishlatiladi. Ma'lumotlar bazasidagi har bir oqsil uchun funktsional parametrlar genetik ontologiyadan olingan (GO), bu funktsional o'xshashlik o'lchovlarini qo'llash imkonini beradi. HTS-PPI kirish ma'lumotlarini rad etish I-Simga to'yinganlikka asoslangan strategiyalarni integratsiyalashuvi orqali amalga oshiriladi, bu aniq aloqa modelini qo'lga kiritadi. Ularning usuli uch xil ma'lumotlar majmuasida qo'llanilgan va boshqa uchta algoritm bilan taqqoslangan (o'zaro ta'sirlarning umumiyligi [14], Chekanovskiy-Dice masofasi [15] va funktsional o'xshashlik og'irligi [16]), bu esa HTS-PPI-ning katta, kamdan-kam ma'lumotlar to'plamlarida yaxshiroq ishlashini ko'rsatadi.Ular oqsillarni tavsiflash uchun GO izohlaridan foydalanganliklari uchun, kam o'rganilgan organizmlarni ko'rib chiqishda, bu yondashuv samarasiz bo'lishi mumkin.
"Ichki geometriya tuzilishi" (IGS) deb nomlangan boshqa strategiya Fang va boshqalar tomonidan taklif qilingan. [23]. IGS-bu berilgan ikkita tugunni bog'laydigan barcha yo'llar haqida tizimli ma'lumotlarni to'plash uchun PPI tarmog'ida issiqlik tarqalishidan foydalanadigan geometriyaga asoslangan yondashuv va shu bilan ular orasidagi ichki munosabatlarni belgilaydi. Ular PPI tarmog'ining global tuzilishini lokal tuzilmadan bashorat qilib, optimal tarqalish vaqtini aniqlash uchun maksimal ehtimollikka asoslangan algoritmdan foydalanadilar. Optimal tarqalish vaqti uchun issiqlik tarqalishini amalga oshirgandan so'ng, PPI tarmog'ining ichki geometrik tuzilishi ochiladi. IGS usulining asosiy afzalliklaridan biri uning etishmayotgan oqsillar assotsiatsiyasi va siyrak PPI ma'lumotlariga nisbatan mustahkamligi hisoblanadi. Ularning usuli S. cerevisiae (CS2007) tarmog'i [24], delfinlar torbasi [25] va ma'lum terrorchi hujayralar tarmog'i [26]. Bundan tashqari, ular IGS ko'rsatkichlarini boshqa ikkita usul bilan taqqosladilar: ko'p o'lchovli o'lchovga asoslangan (MDS) usuli [27] va ierarxik tasodifiy grafik (HRG) usuli [28], bu IGS bir oz yaxshiroq ishlashini ko'rsatdi. MDS CS2007 ma'lumotlar bazasi bilan sinovdan o'tkazilganda va boshqa ma'lumotlar to'plami uchun IGS va HRGdan yaxshiroq. Ularning tahlili faqat qabul qiluvchining ishlash xarakteristikasi (AUC) egri (AUC) qiymatlari ostidagi maydonga asoslangan edi.
Ta'riflangan asarlar orasida Kuchaiev va boshqalar taklif qilgan MDS usuli. [27] a -da qo'llanilgan PPI tarmoq topologiyasiga tayangan yagona Homo sapiens PPI ma'lumotlar to'plami. Tarmoqlarning kamligi muammosini hal qilish uchun Luo va boshqalar. [4] birgalikda filtrlashdan foydalangan, lekin bu usul buzilgan tarmoqlarda, ya'ni tasodifiy shovqin qo'shilganda sinovdan o'tkazilmagan. IGS usuli [23] Xamirturush yordamida MDS usuli bilan solishtirildi Saccharomyces cerevisiae PPI ma'lumotlar to'plami va ikkala usul ham bir xil foizli buzilgan tarmoqlarda sinovdan o'tkazildi (10% dan 80% gacha). Biroq, ular tiklangan qirralarning qaysi biri olib tashlangan guruhga tegishli ekanligini yoki qaysi qirralarning keyin tiklanganligini aniqlay olmadilar.
Ushbu maqolada biz faqat tarmoq topologiyasiga asoslangan PPI tarmoqlarini ajratish uchun tashkilotni o'lchash (OM) usulini joriy etamiz. Topologik o'lchovlar o'zaro ta'sir qiladigan va o'zaro ta'sir qilmaydigan oqsillarning tarqalishini tavsiflovchi tendentsiyalarni topish uchun ishlatiladi. Tarmoqni qurish uchun yuqori darajadagi ishonchli o'zaro ta'sirlar to'plami ishlatiladi, so'ngra tarmoqdagi o'zaro ta'sirlar va o'zaro ta'sirlarning og'irligi hisoblab chiqiladi. OM vaznli matritsa olingan va o'zaro ta'sir taqsimotini o'zaro ta'sirlanmagan taqsimotdan ajratish imkonini beradigan taqsimlanish tendentsiyalarini topish uchun ishlatiladi. Bunday taqsimotlarni yaxshiroq ajratib turadigan OM chegara qiymati soxta musbat (FP) va FN (yangi) o'zaro ta'sirlarni aniqlash uchun ishlatiladi. Shunday qilib, OM topologik modeli tarmoqni ochishda foydalanish uchun qurilgan bo'lib, natijada kutilgan tarmoqni yaxshiroq taxmin qilish mumkin bo'ladi.
XULOSA
Ushbu bo'limda biz tajribalarda ishlatiladigan ma'lumotlar to'plamini va tashkilotni o'lchash (OM) metodologiyasida qo'llaniladigan topologik o'lchovlarni qanday qo'lga kiritganimiz, shu jumladan yangi kvartal klasterlash (NC) taklif qilingan o'lchovi tasvirlangan. Shuningdek, u OM metodologiyasini, OM og'irlik matritsasini qanday olish va chegara qiymatini aniqlashni tasvirlab beradi, tarmoqlarni denoise qilish uchun OM metodologiyasi quvurining tavsifini beradi Har bir organizm uchun biz yuqori ishonchli PPIlar to'plamini to'pladik. Garchi bu PPIlar tanlangan organizmlarning oqsil o'zaro ta'sir tarmoqlarini to'liq aks ettirmasa ham, ular har bir organizmning ma'lum PPI tarmog'ini, ya'ni ularning mos yozuvlar to'plamlarini yaratish uchun ishlatilgan.
OM metodologiyasini qo'llashda, bu tarmoqlarni tavsiflash uchun har xil topologik o'lchovlar hisoblab chiqilgan, bu chora -tadbirlar tarmoq denosini qo'llab -quvvatlash uchun topologik naqshlarni aniqlash imkonini beradi, degan taxminga asoslanadi. Ushbu maqolada biz FP va FN o'zaro ta'sirini aniqlash uchun "denoising" atamasini ishlatamiz, ikkinchisini qo'shganda oldingi holatlarni tarmoqdan olib tashlaymiz. Bu erda taklif qilingan metodologiyani tarmoqdagi allaqachon taqdim etilgan o'zaro ta'sirlarning ishonch darajasini aniqlash uchun ham ishlatish mumkin. Turli topologik o'lchovlar har xil naqshlarni aniqlay oladi, shuning uchun biz har xil topologik o'lchovlar denoizing jarayoniga hissa qo'shishi mumkin deb hisoblaymiz.
2 -bo'limda 2.1 -bo'limda taklif qilingan metodologiyani tasvirlash va tasdiqlash uchun tanlangan ma'lumotlar to'plamining tavsifi va 2.2 -bo'limda OM metodologiyasini sinash uchun ishlatilgan topologik chora -tadbirlar tavsifi, OM metodologiyasi quvuri batafsil tasvirlangan. taklif qilingan topologik chora. 2.3 -bo'limda qo'shni matritsadan tortilgan OM matritsasini olish jarayoni tushuntiriladi, 2.4 -bo'limda OM THR qiymatini ROC egri chizig'idan foydalanib aniqlash mumkin, 2.5 -bo'limda PPI tarmoqlarini denoizingda chegaradan qanday foydalanish kerakligi tasvirlanadi.
Adabiyotlar ro’yxati
2002 Protein-o'zaro ta'sir tarmoqlaridagi potentsial artefaktlar. FEBS Lett . 530, 253-254. Crossref, PubMed, Google Scholar
Amoutzias GD, Robertson D.L., Oliver S.G & amp; Bornberg-Bauer E
. 2004 yildagi yuqori eukaryotlarda bir genli takrorlanishlar orqali konvergent tarmoqlar. EMBO vakili . 5, 274-279. Crossref, PubMed, Google Scholar
. 2004 yil Tarmoq biologiyasi: hujayraning funktsional tashkilotini tushunish. Nat. Rev. Genet . 5, 101–113. Crossref, PubMed, ISI, Google Scholar
Berg J, Laessig M va Vagner A.
. 2004 Protein o'zaro ta'sir tarmoqlarining tuzilishi va evolyutsiyasi: bog'lanish dinamikasi va genlarning takrorlanishining statistik modeli. BMC Evol. Biol . 4, 51. Crossref, PubMed, Google Scholar
Din CM, Salwinski L, Xenarios I va Eisenberg D.
. 2002 yil oqsillarning o'zaro ta'siri: yuqori o'tkazuvchanlik kuzatuvlarining ishonchliligini baholashning ikkita usuli. Mol. Hujayra. Proteomika . 1, 349-356. Crossref, PubMed, Google Scholar
2002 Protein komplekslarini tizimli tahlil qilish orqali xamirturush proteomining funktsional tashkil etilishi. Tabiat . 415, 141-147. Crossref, PubMed, ISI, Google Scholar
Ghaemmagami S, Huh WK, Bower K, Howson R.W, Belle A, Dephoure N, O'Shea E.K & amp; Weissman J.S
. 2003 yil Xamirturushdagi oqsil ekspresiyasini global tahlil qilish. Tabiat . 425, 737-741. Crossref, PubMed, ISI, Google Scholar
2002 Funktsional profil Saccharomyces cerevisiae genom Tabiat . 418, 387-391. Crossref, PubMed, ISI, Google Scholar
Do'stlaringiz bilan baham: |