Manuscript dvi



Download 0,65 Mb.
Pdf ko'rish
bet3/9
Sana24.06.2023
Hajmi0,65 Mb.
#953211
1   2   3   4   5   6   7   8   9
Bog'liq
Robust speaker recognition in noisy conditions IEE

A. Methodology
Denote by
Φ
0
the training set containing
clean
training data for a speaker, and denote by
P
(
X
|
s,
Φ
0
)
the
probability distribution of frame feature vector
X
associated with speaker
s
trained on
Φ
0
. In this study,
we assume that each frame vector
X
consists of
N
subband feature components:
X
= (
x
1
, x
2
, ..., x
N
)
,
where
x
n
represents the feature component for the
n
th subband. We obtain
X
by dividing the whole
speech frequency-band into
N
subbands, and then calculating the feature coefficients for each subband
independently of the other subbands. The subband feature framework has been used in speech recognition
(e.g. [26], [27]) for isolating local frequency-band corruption from spreading into the feature components
of the other bands.
The first step of the UC method is to multiply the training set
Φ
0
by corrupting the clean training
data with simulated noise of different characteristics (e.g., white noise at different signal-to-noise ratios
(SNRs)). Assume that this leads to augmented training sets
Φ
0
,
Φ
1
, ...,
Φ
L
, where
Φ
l
denotes the
l
th
training set derived from
Φ
0
with the inclusion of a certain noise condition. Then a new probabilistic
model for the test frame vector can be formed by combining the probability distributions trained on the
individual training sets:
P
(
X
|
s
) =
L
X
l
=0
P

l
|
s
)
P
(
X
|
s,
Φ
l
)
(1)
where
P
(
X
|
s,
Φ
l
)
is the probability distribution of the frame vector trained on set
Φ
l
and
P

l
|
s
)
is the
prior probability for the occurrence of the noise condition represented in
Φ
l
, for speaker
s
. Eq. (1) is a
multi-condition model. A recognition system based on (1) should have improved robustness to the noise
conditions seen in the training sets
Φ
l
, as compared to a system based on
P
(
X
|
s,
Φ
0
)
.
The second step of the UC method is to make (1) robust to noise conditions not fully represented in
the training sets
Φ
l
without assuming extra noise information. One way to this is to ignore the heavily
mismatched subbands and focus the score only on the matching subbands. Let
X
= (
x
1
, x
2
, ..., x
N
)
be
a test frame vector and
X
Φ
l
,s

X
be a subset in
X
containing all the subband components that match
the corresponding model components trained in noise condition
Φ
l
for speaker
s
. Then, using
X
Φ
l
,s
in
place of
X
as the test vector for each trained noise condition, redefine (1) as
P
(
X
|
s
) =
L
X
l
=0
P

l
|
s
)
P
(
X
Φ
l
,s
|
s,
Φ
l
)
(2)
November 10, 2005
DRAFT


5
where
P
(
X
Φ
l
,s
|
s,
Φ
l
)
is the marginal distribution of the matching subset
X
Φ
l
,s
, derived from
P
(
X
|
s,
Φ
l
)
with the mismatched subband components ignored to improve mismatch robustness between the test
frame
X
and the trained noise condition
Φ
l
(i.e. the missing-feature principle). For simplicity, assume
independence between the subband components. So the marginal distribution
P
(
X
sub
|
s,
Φ
l
)
for any subset
X
sub

X
can be written as
P
(
X
sub
|
s,
Φ
l
) =
Y
x
n

X
sub
P
(
x
n
|
s,
Φ
l
)
(3)
where
P
(
x
n
|
s,
Φ
l
)
is the probability distribution of the
n
th subband component for speaker
s
trained
under noise condition
l
.
Given a test frame
X
, the matching component subset
X
Φ
l
,s
for each
Φ
l
and
s
may be defined as the
subset in
X
that gains maximum probability over the appropriate noise condition and speaker. Such an
estimate for
X
Φ
l
,s
is not directly obtainable from (3) by maximizing
P
(
X
sub
|
s,
Φ
l
)
with respect to
X
sub
.
This is because the values of
P
(
X
sub
|
s,
Φ
l
)
for different sized subsets
X
sub
are of a different order of
magnitude and are thus not directly comparable. One way around this is to select the matching subset for
noise condition
Φ
l
and speaker
s
that produces the highest probability for this noise condition/speaker,

Download 0,65 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish