17 хромосом
N50
|
218,329
|
2,091,826
|
924,431
| Геном йиғилиши сифатини баҳолаш учун мавжуд кўрсаткичлар
●
Референссиз кўрсаткичлар
●
Контиглар сони
Контигларнинг умумий
узунлиги
N50. Мумкин бўлган максимал контиг узунлиги, бу қийматдан узунроқ бўлган контиглар йиғилишнинг камида ярмини ташкил қилади.
●
●
●
L50. Йиғилишнинг камида ярмини ташкил этадиган контигларнинг минимал сони. Юқоридаги мисолда L50 = 5.
Геном йиғилиши сифатини баҳолаш учун мавжуд кўрсаткичлар
●
Референс геномни ишлатувчи метрикалар
●
Йиғиш хатоликлари
NGA50. «Созланган» N50
●
●
Йиғилган геном фоизи
Такрорлаш кўрсаткичи
●
Дастурий таъминот модулларининг ўзаро таъсири схемаси
Набор контигов 1
Набор контигов n
Набор контигов 2
Набор ридов
≈1000 строк кода Язык:
Python + небольшая часть на C++
Построение
индекса
Построение
индекса
Построение
индекса
Построение гистограммы
Индекс 1
Индекс n
Индекс 2
Построение индекса
Индекс
ридов
Гистограмма k-меров
в ридах
Множество уникальных
k-меров в ридах
Анализ гистограммы
Подсчет значения Q
Jellyfish
Набор Python модулей
Измененная библиотека Jellyfish
Геном йиғувчилар ишининг натижаларини бирлаштириш. Мавжуд ечимлар
●
CISA , MIX
●
Заиф кенгайтириладиган: кетма-кет дастурлар, катта геномлар учун қўлланилмайди
●
Ресурс интенсивлиги: бир қатор кириш маълумотлари бўйича иш вақти бир неча кунга етиши мумкин.
●
Якуний йиғилишнинг сифати бирлашишда иштирок этадиган битта йиғилишдан кўра ёмонроқ бўлиши мумкин.
Геном йиғувчилар ишининг натижаларини бирлаш тириш. Алгоритмнинг мураккаблигини баҳолаш
●
Максимал узунлиги L бўлган жами n та сўз бўлсин
●
Мегабласт дастури билан сўзларни жуфтлик билан мослаштириш - O(n*L)
●
Қоплама графигини қуриш - О (|E|), бу ерда Э - жуфт текислаш матрицаси билан берилган графикдаги қирраларнинг тўплами, |Е | ~ n
●
LabelRank графигини алгоритм бўйича кластерлаш – O(|E|)
●
Ҳар бир кластердаги сўзларни алгоритм билан бирлаштириш ‑ O(|E|)
●
Бирлаштирилган контигларни тузатиш - O(|E|)
●
Умумий мураккаблик - O(n*L) + O(|E|)
Геном йиғувчилари ишларининг натижа ларини бирлаштириш. Таклиф этилаётган усул
●
Белгиланган чекловлар:
●
Йиғилаётган геном 1 та тўплам хромосома тутади
●
Қисқа фрагментлар фақат битта организмнинг геномини ўз ичига олади
●
Асл контиг тўпламларида хатолар тузатилмайди
Геном йиғувчилари ишларининг натижаларини бирлаштириш . Намуна
геном
1 тўплам
2 тўплам
3 тўплам
Геном йиғувчилари ишларининг натижаларини бирлаштириш . Намуна
геном
1 тўплам
2 тўплам
3 тўплам
Геном йиғувчилар ишларининг натижаларини бирлаштириш . Намуна
Do'stlaringiz bilan baham: |