Аnalysis of methods of classification of speech signals
This article is devoted to the analysis of speech signal classification methods, the task of
automatic identification of the person is investigated. To solve this problem, the existing methods are
described, the classification is based on the application of the method of the Gaussian mixture model. In
addition, the results of testing and conclusions of the application of the Gaussian mixture model for
solving the problem of recognition are given.
Keywords: signal, vector, model, method, algorithm, distribution function, distance, Lagrange
multipliers, probability, activation function, core function, shift value, expectation, linear and nonlinear
selection, neuron, perceptron.
Кириш. Сўнгги йилларда шахсни нутқи асосида таниб олиш тизимлари
жадал ривожланмоқда. Ушбу тизимларнинг ривожланишига асосий сабаб
биометрик қидирув, бошқарув, верификациялаш, хавфсизлик, банк ва электрон
тижорат каби соҳалардаги талабнинг ошишидир.
Шахсни нутқи асосида таниб олиш тизимларининг бошқа биометрик таниб
олиш тизимларидан муҳим афзалликларидан бири унинг кам харажатлилиги
ҳисобланади [1]. Бундан ташқари, замонавий шахсни нутқи асосида таниб олиш
тизимлари ишончлилик даражаси бўйича баъзи таниб олиш тизимларидан
қолишмайди ва айримларидан эса юқори ҳисобланади. Масалан, шахсни тасвири
асосида таниб олиш тизимларига нисбатан юқоридир [2].
Нутқ таниб олиш тизимларининг ривожланиши инсон нутқини автоматик
таниб олиш билан бирга уни синтезловчи интеллектуал тизимларнинг
яратилишига ҳам олиб келди. Шахс нутқининг ягоналиги бошқа биометрик
тизимлар каби 100% ишончли таниб олишни кафолатлай олмайди.
Нутқи асосида таниб олиш тизимларида юзага келадиган хатоликларнинг
асосий манбаи сифатида қуйидагиларни келтириш мумкин:
атроф-муҳитдаги ҳодиса ва жараёнлар (ҳалақитлар, реверберация ва
бошқалар);
нутқнинг ўзига хослиги (давомийлиги, тоналлиги, овоз даражаси ва
бошқалар);
алоқа каналининг сифати (узатиш канали ва ёзиш ускуналаридаги
ўзгаришлар, нутқ сигнални кодлашдаги хатоликлар ва бошқалар); [2-5].
Шахсни нутқи асосида таниб олиш кўплаб масалаларни ечишни талаб
қилади:
- нутқ сигналнинг тўхташ ва турли ҳалақитли қисмларини ташлаб юбориш
орқали вокал қисмини ажратиб олиш;
- суҳандонлар нутқларини ажратиш (диаризациялаш масаласи);
- суҳандон нутқини характерловчи белгиларини аниқлаш.
Суҳандонни таниб олиш ва верификациялаш технологияси қуйидаги
масалаларни ечиш имконини беради:
- матн ва тилга боғлиқ бўлмаган ҳолда шахсни таниб олиш;
- аудио файллар орасидан қидирилаётган шахс нутқи мавжуд бўлган
файлларни аниқлаш;
- аудио маълумотлардаги шахсларни аниқлаш;
- оператор ишини автоматлаштириш (масалан, кириш-чиқишни назорат
қилишда);
- катта ҳажмдаги нутқ ахборотларини қайта ишлаш [12].
Do'stlaringiz bilan baham: |