1. Genomlar organizmning chizmalari sifatida Genomlar ketma -ketligini aniqlash



Download 61,63 Kb.
bet15/18
Sana14.06.2022
Hajmi61,63 Kb.
#668763
1   ...   10   11   12   13   14   15   16   17   18
Bog'liq
Nurullayev Bekzod (genomika)

Ilmiy primer, Milliy Biotexnologiya Axborot Markazida (NCBI) molekulyar ma'lumotlar bazalari ortidagi fanni tushuntiruvchi NCBI resursi. Mavzularga bioinformatika, genom xaritasi, molekulyar modellashtirish, SNP, EST, mikroarray texnologiyasi, molekulyar genetika, farmakogenomika va filogenetika kiradi.
Access Excellence tomonidan Genlar testini tushunish genlarning kasallik bilan qanday bog'liqligini o'rganadi va genetik testning tabiati va qo'llanilishini muhokama qiladi.
AQSh Energetika vazirligining "Inson genomlari" loyihasi haqida ma'lumot saytida turli xil ta'lim manbalariga havolalar, shu jumladan lug'at, ilmiy asosva turli xil nashrlar, o'quv qo'llanmalari va onlayn animatsiyalar.

Kirish
O'q otish quroli metagenomikasi va marker genlari ketma-ketligi biz hozircha ajratib ololmaydigan va laboratoriyada etishtira olmaydigan organizmlarni tadqiq qilish va o'rganish uchun kuchli vositadir. Bu, ayniqsa, bakterial va arxaeal jamoalar uchun madaniyatliligi baholanadigan ekologik namunalar uchun to'g'ri keladi
Okean va ko'llar uchun 10-70% va
Okean cho‘kindilari uchun 8–32% [1]. Olimlar murakkab namunalarning genom tahlilini ta'minlash uchun ov miltig'i metagenomikasiga murojaat qilishdi, ammo ov miltig'i metagenomikasi ma'lumotlaridan genomlarni yig'ish madaniyatli izolatlarni yig'ishdan ko'ra qiyinroq. Metagenomikani yig'ishdagi qiyinchiliklar namunalarning heterojenligi, mavjud ketma-ketlik texnologiyasi va biz yig'ish va genomni bog'lash uchun foydalanadigan bioinformatika algoritmlarining cheklovlaridan kelib chiqadi [2]. Metagenomlar noma'lum sonli genomlarning notekis miqdorini o'z ichiga oladi, bu esa taxminlarni, vaqtni va kompyuter xotirasini soddalashtirish nuqtai nazaridan murakkab hisoblash muammosini keltirib chiqaradi.
1990-yillarda birinchi genomlar ketma-ketligi va yig'ilishida olimlar yig'ish uchun Sanger sekvensiyasi va o'zaro kelishuv konsensus (OLC) usullaridan uzoq o'qishlardan foydalanganlar [3]. Yangi avlod ketma-ketligi texnologiyasini ishlab chiqish bilan biz millionlab o'qishni ketma-ket arzonlashtirish evaziga qobiliyatga ega bo'ldik, lekin an'anaviy OLC algoritmlaridan foydalanish hisob-kitob intensivligiga aylandi. OLC algoritmlarining hisoblash murakkabligi kiritilgan oʻqishlar sonining kvadrati sifatida oʻlchanadi (chunki har bir oʻqish boshqa har bir oʻqish bilan solishtiriladi), shuning uchun ular Sanger ketma-ketligidan hosil boʻlgan minglab oʻqishlar bilan solishtirganda millionlab oʻqishlar maʼlumotlar toʻplami uchun amaliy emas. Aniqroq aytganda, bir -biriga o'xshashlik identifikatori odatda dinamik dasturlash orqali aniqlanadi, bu o'qish sonining kvadratiga (d) va ularning uzunligi (n), shuning uchun murakkablik O(d 2 n 2 ) yoki O(N 2 ). Aksariyat OLC assemblerlari dinamik dasturlashni qo'shimcha daraxt algoritmlari bilan birlashtiradi O(N+a), qayerda a Bu bir -biriga mos keladigan umumiy soni va shuning uchun murakkabligi O(d 2 ). Ma'lumotlar ketma -ketligini to'kish uchun (o'qishlar va loyihalar hajmi bo'yicha) de Bryuyn grafigini yig'ish usullari ishlab chiqilgan.
De Bryuijnga asoslangan yig'ish algoritmlarining vaqt va xotira murakkabligi odatda o'qishlar soni o'rniga metagenomning o'lchami va murakkabligi bilan o'lchanadi [4]. De Bryuijn grafigi yondashuvi o'qishni k-mersga yoki uzunlikdagi qisqa ketma-ketliklarga ajratadi. k, va faqat noyob k-merslar tugunlarni grafikga qo'shadilar [4]. Bu OLC montajchilariga nisbatan hisoblash talablarini kamaytiradi, lekin noto'g'ri yig'ilishlarni ham keltirib chiqarishi mumkin. O'qishning k-mersga bo'linishi tufayli kontekst yo'qoladi va grafiklarda haqiqiy genomik ketma-ketlikka mos kelmaydigan yo'llar bo'lishi mumkin [4,5] (garchi ba'zi kontekstni tiklash mumkin bo'lsa ham) Chunki xaritani kiritish usuli [4] grafikga qaytadi). Celera Assembler [6], SGA [7] va MIRA [8] kabi an'anaviy OLC assemblerlari faqat haqiqiy genom ketma-ketligiga mos keladigan kontiglar ishlab chiqarilishini ta'minlaydi (bu ba'zan o'qish muvofiqligini saqlash deb ataladi). Bu OLC assemblerlarida noto'g'ri yig'ilishlar yo'q degani emas [9], lekin asl nusxadagi qimmatli kontekstning ba'zilari k-merga asoslangan yig'ish yondashuvlari yordamida yo'qolishi mumkin.
Uzoq vaqt davomida o'qiladigan ketma-ketlikni qo'llash k-mer asosidagi yig'ish bilan bog'liq ba'zi muammolarni bartaraf etishga yordam beradi va bu turdagi ma'lumotlar uchun yangi assemblerlar yana OLC yig'ish usullaridan foydalanishni boshladilar [5]. Biroq, uzoq vaqt davomida o'qiladigan ketma-ketlik qisqa o'qish texnologiyalari (1 nanogramgacha) bilan solishtirganda yuqori sifatli va yuqori molekulyar og'irlikdagi (10-50 kb) DNK (mikrogramlar) ni talab qiladi [10,11]. Etarlicha yuqori molekulyar og'irlikdagi DNKni ajratib olish namuna olish xarajatlari va mavjud biomassa bilan cheklanishi mumkin, ayniqsa atrof-muhit namunalarining ayrim turlari uchun, shuning uchun qisqa o'qish ketma-ketligi ba'zan yagona variant bo'lishi mumkin.
Yig'ishdan tashqari, metagenomikaning asosiy muammosi kontiglarni genom qutilariga guruhlashdir. Biz "contig" dan dastlab Rodjer Staden tomonidan ta'riflanganidek foydalanamiz, bunda kontig - o'q otish sekvensiyasidan DNKning bir-biriga o'xshash segmentlari to'plamidir [12]. To'liq genomning bitta bo'lakka yig'ilishi kamdan-kam uchraydi de novo qisqa o'qishlardan, shuning uchun kontiglar ko'pincha qamrov va tetranukleotid chastotalariga asoslanib, "qutilar" ga guruhlanadi. Agar ikkita gen bir genomga tegishli bo'lsa, ular o'xshash qoplamali va tetranukleotidli profillarga ega bo'lishi kutilmoqda [13]. Biroq, qamrov turli sabablarga ko'ra muammolarga ega. Agar ma'lum bir mikrob tez o'sayotgan bo'lsa, ba'zi hududlar genomning qolgan qismiga qaraganda yuqori qamrovga ega bo'lishi mumkin [14]. Bundan tashqari, ribosomal RNK (rRNK) operonlarining nusxa ko'chirish soni birlikdan oshib ketadigan organizmlar uchun, rRNK genlari bilan bog'liq bo'lganlar genomdagi qolgan kontiglar bilan bir xil qoplamaga ega bo'lmaydi. Bu boshqa ko'p nusxali genlar va boshqa takrorlanuvchi elementlarga ham tegishli. Tetranukleotid chastotalari muammoli, chunki gorizontal ravishda o'tkazilgan hududlar genomning qolgan qismidan farqli chastotalarga ega bo'lishi mumkin [15] va bu shunday bo'laklarni biriktirish algoritmi bilan turli xil qutilarga qo'yishga olib kelishi mumkin. Bu muammolarga qaramay, binning metagenomik ma'lumotlarning potentsial genomlarini aniqlashda, ayniqsa, qisqa o'qish ketma -ketligi texnologiyalaridan foydalanishda yordam beradi.
Qutining sifatini baholash uchun ko'pincha "ifloslanish" va "to'liqlik" ko'rsatkichlari qo'llaniladi. To'liqlik va ifloslanish odatda to'liq izolyatsiyalangan genomlarning saqlanib qolgan xususiyatlarini buzish orqali aniqlanadi. Bunday xususiyatlarga tetranukleotid chastotasida hech qanday takrorlanishsiz yoki haddan tashqari o'zgarishsiz universal (yoki hech bo'lmaganda filogenetik) saqlangan bitta nusxali oqsil genlarining to'liq to'plamlari kiradi. Hamma joyda mavjud bo'lgan genlarning asosiy konservalangan to'plamini yaratish kabi boshqa to'liqlik choralari taklif qilingan. RefineM [16] va CheckM [17] kabi asboblar ushbu qoidalarni bakteriyalar va arxaeal genomlarning to'liqligi va ifloslanishini aniqlash uchun yig'ilishlarga qo'llaydi. Biroq, bu vositalar yaxshi o'rganilmagan turlarga har doim ham to'g'ri kelavermaydi. Nomzod Phyla Radiation (CPR) turlari ko'pincha ushbu vositalar tomonidan 60-80% to'liqlikka ega deb tasniflanadi, hatto ushbu turlarning dumaloq genomlari uchun [18]. Bog'lanishdagi qiyinchiliklarni bartaraf etish uchun olimlar metagenomlardan aylana, to'liq genomlarni yig'ishni boshladilar [18-27], ular CMAG (to'liq metagenomik yig'ilgan genomlar) [28] deb ham ataladi. Genom qutilari bilan taqqoslaganda, noto'g'ri yig'ilishlarni nazorat qiluvchi va dumaloq genomlardan tashkil topgan yuqori sifatli ma'lumot to'plami (1) murakkab mikrobiomlar ichidagi madaniyatsiz mikroblarning identifikatori va imkoniyatlarini baholashning aniqroq xulosasini beradi, (2) aniqroq taksonomik baholash imkonini beradi. bu mikrobiomalarning tarkibi bitta organizmda marker genlarni yaxshiroq bog'lash orqali, (3) o'qishlarni yig'ish mumkin bo'lgan yuqori sifatli iskala beradi, bu ham mikrobiomni o'rganish jarayonida o'zgaruvchanlik o'zgarishini o'lchash imkonini beradi va o'qishni yaxshiroq yig'ishga yordam beradi. ko'plab mikrobioma namunalari va (4) bu organizmlardagi genlarning sinteniyasi va genomik kontekstini o'rganish imkoniyatini beradi. Bundan tashqari, yuqori sifatli MAGlarni yaratishning mavjud usullari mavjud bo'lsa-da, bu MAGlar hali ham ekzogen ketma-ketlik bilan sezilarli darajada ifloslanganligini va o'qish muvofiqligi yo'qligidan kelib chiqqan noto'g'ri yig'ilishlarga ega ekanligi haqida dalillar mavjud [29]. Genomlarning sirkulyasiyasi yig'ilishlarda ifloslanish yo'qligi ehtimolini oshirishga yordam beradi. Genomlarni sirkulyatsiya qilishning afzalliklariga qaramay, hozirgi kunga qadar juda kam metagenomik tadqiqotlar (& lt30) dumaloq genomlarni nashr etgan [18,19,28,20–27].
Biz metagenomik ma'lumotlardan dumaloq arxaeal, bakterial va virusli genomlarning tiklanishini osonlashtiradigan va noto'g'ri yig'ilishlarni tekshirishni ta'minlaydigan Jorg nomli yarim avtomatik usulni tasvirlaymiz. Bu usulni engillashtirish uchun biz GitHub (https://github.com/lmlui/Jorg) da mavjud bo'lgan skriptlar va o'quv qo'llanmalarni, shuningdek DOE tizimlari biologiyasi bo'yicha bilimlar bazasi (KBase) ilovasini hozirda beta -versiyada ishlab chiqdik ( https://appdev.kbase.us/#appcatalog/app/kb_jorg/run_kb_jorg/beta) [30]. Bu usul xamirturush kabi to'liq eukaryotik mikrob genomlarini yig'ishga yordam berish uchun mo'ljallanmagan, ammo bu turlarda kontiglarni kengaytirishga yordam berish uchun ishlatilishi mumkin. Bundan tashqari, u asosan bir necha marta takrorlanadigan kichik genomlar uchun qo'llanilishi kerak, ammo barcha metagenom qutilarida kontiglarni kengaytirishga yordam berish uchun ishlatilishi mumkin. Ushbu tadqiqotda biz ma'lumotlar to'plamidan qanchadan -qancha dumaloq genomlarni olishimiz mumkinligi haqida emas, balki qiziqish qutilarini dumaloqlashtirishda va ularning yuqori sifatli bo'lishida yordam beradigan usulning o'zi haqida to'xtalamiz. Doiraviy genomlarning mashaqqatlariga yordam berish uchun bizning usulimiz k-mer asosidagi yig'ilishdan foydalanish bilan bog'liq muammolarni bartaraf qiladi va kontiglarning iterativ kengaytmasini avtomatlashtiradi.Bizning umumiy yondashuvimiz "standart" metagenomik yig'ilishni ishlab chiqarish, "standart" yig'ish vositasidan foydalangan holda saqlash, k-mer o'xshashligi asosida o'qishlarni chiqarish va "standart" izolyatsiyaga yo'naltirilgan assembler yordamida ularni qayta yig'ishdir. Ushbu usulni ko'rsatish uchun biz 19 ta ommaviy va nashr etilgan metagenomik ma'lumotlar to'plamidan 34 dumaloq CPR genomini, bitta dumaloq Margulisbakteriya genomini, bitta xlorofleksi genomini va ikkita dumaloq megafag genomini oldik. Bizning ma'lumotimizga ko'ra, 9 ta tadqiqotdan faqat 18 ta CPRning sirkulyatsiyalangan genomlari nashr etilgan [18-26], shuning uchun biz bu bitta tadqiqotda aylana CPR genomlarining eng katta taqdimoti deb hisoblaymiz. Ushbu to'plam yordamida biz ko'p sonli noyob dumaloq genomlarsiz qiyin bo'lishi mumkin bo'lgan topilmalarni namoyish etamiz, shu jumladan CPRning ko'p qismida ribosomal genlar operonik emas va CPR turlarida RNaz P RNKning turli shakllarini topamiz.


Download 61,63 Kb.

Do'stlaringiz bilan baham:
1   ...   10   11   12   13   14   15   16   17   18




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish