O‘zbekiston respublikasi fanlar akademiyasi


Система распознавания каракалпакской речи



Download 2,9 Mb.
Pdf ko'rish
bet66/79
Sana24.02.2022
Hajmi2,9 Mb.
#247036
1   ...   62   63   64   65   66   67   68   69   ...   79
Bog'liq
5e463f2487433

Система распознавания каракалпакской речи. В этой системе 
распознавания речи первоначально выполняется подготовка данных, при которой 
из каждого из 10 говорящих на каракалпакский собираются записи из 150 слов. С 
использованием фонетической транскрипции составляетя фонетический словарь и 
разрабатывается акустическая и языковая модель. 
База каракалпакский слов используется в этой работе и содержит корпус 
речи и их транскрипцию. В корпусе содержится 150 слов, собранных из каждого 
из 10 говорящих. Для облегчения зачади маркировки речевых сигналов 
аудиофайлы были сгенерированы словами в алфавитном порядке. Частота 
дискретизации записи составляет 16 кГц с разрешением 16 бит. 


93 
Далее был создан файл речевых правил (файл транскрипций), который 
содержит транскрипции для каждого предложения конкретной аудиозаписи (файл 
назван asr5_train.transcription). Для каждой транскрипции указаны начало и конец 
предложения. В конце указаны имена файлов (без расширения) аудиозаписи 
данного предложения. Пример:
Файл транскрипций содержит: 
 BELGILE  (p_belgile) 
 BIYKARLA  (p_biykarla) 
Файлы: 
p_belgile.wav 
p_biykarla.wav 
Следующий этап – это создание словаря. Словарь содержит все слова
которые находятся в файле транскрипций в алфавитном порядке без повторений. 
После каждого слова прописана фонетический разбор слова. Фонемы указывались 
по определенному правилу.
Пример: Файл asr5.dic 
ALDI`G`A A L D Y GH A 
ALDI`N`G`I` A L D Y NG GH Y 
ALI`W 
A L Y W 
ALPI`S 
A L P Y S 
ALTI` 
A L T Y 
AQI`RI` 
A KH Y R Y 
AQI`RI`NA A KH Y R Y N A 
Обучение. Обучение — это процесс тренировки акустической и языковой 
модели вместе со словарем произношения, чтобы создать базу данных для 
использования в системе распознавания. Обучение акустической модели 
выполняется с использованием инструментов CMU Sphinx. 
Акустическая модель 
В акустической модели наблюдаемые особенности фонем (базовых 
речевых единиц) сопоставляются со скрытой Марковской моделью(HMM). Слова 
в словаре моделируются как последовательность фонем, а каждая фонема 
моделируется как последовательность состояний модели. 
Языковая модель 
В этой системе модель языка n-граммы используется для поиска 
правильной 
последовательности 
слов. 
Поиск 
осуществляется 
путем 
прогнозирования 
вероятности 
n-го 
слова 
с 
использованием
n - 1 предшествующих слов. Обычно используются n-граммовые модели: 
униграмма, биграмма и триграмма. Языковая модель создается путем вычисления 
количества униграмм слова, которые преобразуются в словарь задач с частотами 
слов. Биграммы и триграммы генерируются из учебного текста на основе этого 
словаря. В этой работе для создания языковой модели этой системы используется 
инструментарий 
моделирования 
статистического 
языка 
в 
Кембридже 
(CMUCLMTK). 

Download 2,9 Mb.

Do'stlaringiz bilan baham:
1   ...   62   63   64   65   66   67   68   69   ...   79




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish