Introduction to Algorithms, Third Edition


Longest common subsequence



Download 4,84 Mb.
Pdf ko'rish
bet256/618
Sana07.04.2022
Hajmi4,84 Mb.
#534272
1   ...   252   253   254   255   256   257   258   259   ...   618
Bog'liq
Introduction-to-algorithms-3rd-edition

15.4
Longest common subsequence
Biological applications often need to compare the DNA of two (or more) dif-
ferent organisms.
A strand of DNA consists of a string of molecules called


15.4
Longest common subsequence
391
bases
, where the possible bases are adenine, guanine, cytosine, and thymine.
Representing each of these bases by its initial letter, we can express a strand
of DNA as a string over the finite set
f
A
;
C
;
G
;
T
g
.
(See Appendix C for
the definition of a string.)
For example, the DNA of one organism may be
S
1
D
ACCGGTCGAGTGCGCGGAAGCCGGCCGAA
, and the DNA of another organ-
ism may be
S
2
D
GTCGTTCGGAATGCCGTTGCTCTGTAAA
. One reason to com-
pare two strands of DNA is to determine how “similar” the two strands are, as some
measure of how closely related the two organisms are. We can, and do, define sim-
ilarity in many different ways. For example, we can say that two DNA strands are
similar if one is a substring of the other. (Chapter 32 explores algorithms to solve
this problem.) In our example, neither
S
1
nor
S
2
is a substring of the other. Alter-
natively, we could say that two strands are similar if the number of changes needed
to turn one into the other is small. (Problem 15-5 looks at this notion.) Yet another
way to measure the similarity of strands
S
1
and
S
2
is by finding a third strand
S
3
in which the bases in
S
3
appear in each of
S
1
and
S
2
; these bases must appear
in the same order, but not necessarily consecutively. The longer the strand
S
3
we
can find, the more similar
S
1
and
S
2
are. In our example, the longest strand
S
3
is
GTCGTCGGAAGCCGGCCGAA
.
We formalize this last notion of similarity as the longest-common-subsequence
problem. A subsequence of a given sequence is just the given sequence with zero or
more elements left out. Formally, given a sequence
X
D h
x
1
; x
2
; : : : ; x
m
i
, another
sequence
Z
D h
´
1
; ´
2
; : : : ; ´
k
i
is a
subsequence
of
X
if there exists a strictly
increasing sequence
h
i
1
; i
2
; : : : ; i
k
i
of indices of
X
such that for all
j
D
1; 2; : : : ; k
,
we have
x
i
j
D
´
j
. For example,
Z
D h
B; C; D; B
i
is a subsequence of
X
D
h
A; B; C; B; D; A; B
i
with corresponding index sequence
h
2; 3; 5; 7
i
.
Given two sequences
X
and
Y
, we say that a sequence
Z
is a

Download 4,84 Mb.

Do'stlaringiz bilan baham:
1   ...   252   253   254   255   256   257   258   259   ...   618




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish