1.1
2.1
1.2
3.1
3.2
2.2
3.3
2,3
3.4
1.3
геном
1 тўплам
2 тўплам
3 тўплам
Геном йиғувчилар ишларининг натижаларини бирлаштириш . Намуна
1.1
2.1
1.2
2.2
2,3
1.3
Объединение контигов жадным алгоритмом
внутри каждой области
3.1
3.2
3.3
3.4
геном
1 тўплам
2 тўплам
3 тўплам
Геном йиғувчилар ишларининг натижаларини бирлаштириш . Намуна
1.1
2.1
1.2
2.2
2,3
1.3
Объединение контигов жадным алгоритмом
геном
1 тўплам
2 тўплам
3 тўплам
внутри каждой области
3.1
3.2
3.3
3.4
Геном йиғувчилар ишларининг натижаларини бирлаштириш . Намуна
1.1
2.1
1.2
3.1
3.2
2.2
3.3
2,3
3.4
1.3
Объединение контигов жадным алгоритмом внутри каждой области
дубликатларни
йўқотиш
геном
1 тўплам
2 тўплам
3 тўплам
Геном йиғувчилар ишларининг натижаларини бирлаштириш . Намуна
1.1
2.1
1.2
3.1
3.2
2.2
3.3
2,3
3.4
1.3
Объединение контигов жадным алгоритмом внутри каждой области
Натижа
геном
1 тўплам
2 тўплам
3 тўплам
Таклиф этилаётган усул. Saccharomyces cerevisiae S228C натижалари
Программа*
|
NGA50
|
Ошибки сборки
|
Число контигов (>=500 символов)
|
Показатель дублирования (%)
|
Покрытие генома (%)
|
Abyss
|
25177
|
58
|
757
|
0.3
|
92.633
|
Ray
|
13033
|
32
|
358
|
0.5
|
57.669
|
SOAPdenovo
|
15771
|
64
|
1633
|
0.6
|
92.813
|
Spades
|
73166
|
50
|
2584
|
0.3
|
93.703
|
IDBA
|
45419
|
58
|
1708
|
0.3
|
93.480
|
Velvet
|
18811
|
62
|
1011
|
0.4
|
89.529
|
MIX
|
73233
|
55
|
2515
|
0.5
|
93.654
|
CISA
|
74268
|
59
|
1869
|
0.9
|
93.752
|
Предложенный метод
|
79654
|
58
|
287
|
2.2
|
93.777
|
А5 йиғувчи ўз ишини тугатмади.
Программа
|
Время
|
ОП
|
Место на диске
|
Mix
|
40 м
|
1,9 Гб
|
388 Мб
|
CISA
|
15 ч
|
219 Мб
|
217 Мб
|
Предложенный метод
|
2 м
|
244 Мб
|
100 Мб
|
AMD FX-8350
1.4Ghz 8-core 32 GB RAM
Геномни йиғиш. Таърифлар
●
Assembly(сборка) – результат работы сборщика, набор контигов (длинных фрагментов генома)
Read(чтение) – короткий фрагмент генома
Paired read(парное чтение) – read , пропуск <= 500 bp,
1
read
2
Mate-pair(парное чтение с большим интервалом) – read , пропуск >= 1 kbp, read
1 2
k-mer – последовательность длины k
Contig(контиг) – последовательность, полученная в процессе сборки, не содержащая gaps(N)
Scaffold(скаффолд) – последовательность, полученная в процессе сборки, содержащая gaps(N)
●
●
●
●
●
●
Секвенслаш технологиясини ривожланиши Ўқиш турлари. Жуфтланган ўқишлар
●
Paired-end (200-500)
●
Mate pair (2-5k)
Йиғувчилар хатоликлари
●
- Relocation – контигнинг икки қисмини ҳаволага бўш жой> = 1000 белги ёки бир-бирига ўхшаш> = 1000 белги билан хариталаш
- Inversion – контигнинг икки қисмини ДНК нинг турли занжирларига хариталаш
- Translocation – контигнинг икки қисмини турли хромосомаларга хариталаш
Дастур комплексини чизмаси
Набор ридов
Скорректированный набор ридов
Фильтрация шума и загрязнений
A5 ABYSS IDBA
Ray SOAP
denovo
SPAdes Velvet
Запуск сборщиков
Набор контигов A5
Набор контигов Velvet
Набор контигов ABYSS
Выбор k, максимизирующего
предложенную метрику
Набор расширенных контигов
Объединение контигов
Геном йиғувчилари ишининг натижаларини бирлаштириш. Таклиф этилаётган усул
●
Кластеризация взвешенного графа контигов:
Label Propagation – подобный итеративный алгоритм
Для каждой вершины добавляется петля, взвешенная средним весом её ребер. Каждой вершине ставится в соответствие пара <метка; вероятность>
На каждой итерации для каждой вершины вычисляется новое множество меток
Критерий остановки – количество обновлений меток либо равно 0, либо повторилось более чем t раз,
t ‑ параметр алгоритма
●
●
●
●
Таклиф этилган усул. Saccharomyces cerevisiae S228C натижалари
4. Геномика ва биоинформатиканинг келажаги.
Генетик маълумотлар банки.
Претенциоз тиббиёт, келажак тиббиёти ташхис ва терапия борлигини билади. Айтайлик, маълум бир касалликни даволовчи бешта дори бор. Агар онкология ҳақида гапирадиган бўлсак, бу бешта дорининг ҳар бири ақлдан озган пулга олинади - ойига ўн минглаб доллар. Бундай терапиядаги хато беморнинг ҳаётини ҳисобга олмаганда, катта пул талаб қилади. Ушбу беморга мос келадиган терапияни танлаш учун унинг ҳужайралари қандай жойлашганлигини, қандай геномга эга эканлигини, қандай касаллик борлигини ва у билан қандай курашиш кераклигини аниқлаш керак. Бу келажак дориси деб аталади.
У нафақат биоинформатикани, балки анча мураккаб фанларни ҳам ўз ичига олади. Биоинформатика бу жараённинг фақат кичик бир қисмидир. Шунга қарамай, унда муҳим рол ўйнайди, чунки ўрганилаётган жараёнлар жуда мураккаб, улар ҳақида жуда кўп маълумотлар мавжуд. Ўртача одам, бу маълумотларга қараб, кўп нарсани тушуна олмайди. Бу ерда ахборот технологиялари ёрдамга келади, бу маълумотларни тўплаш, тизимлаштириш, таҳлил қилиш ва натижани оддий одам учун тушунарли шаклда беришга ёрдам беради. Ягона нуклеотид, геном ва эпигеномни таҳрирлаш. Генетик маълумотлар банклари (биобанклар, биологик намуналарни сақлайдиган биорепозиторийлар. GeneBank.
Do'stlaringiz bilan baham: |