Home Научные направления исследований Научные результаты 5.4 Распознавания голосовых команд

Распознавания голосовых команд русской речи на основе построения дескрипторных полей в области частотно-временных спектров.

Целью проведения НИР является построение системы распознавания голосовых команд (отдельных слов и словосочетаний).

Реализация системы строится на основе существующих методов и подходов описания голосового тракта, построение акустических моделей голоса (использование скрытых Марковских моделей, смешанных гауссовских моделей, N-граммные модели и т.д., обучение моделей с использованием различных алгоритмов (SVM, AdaBoost, Boosting) на тестовых наборах голосовых команд) с использованием оригинальных дескрипторных структур (построение индексных полей с помощью локально-полиномиальной аппроксимации семействами функций), полученных при обработке  сигналов во временной области, частотно-временной области и частотной области.     

В результате выполнения проект планируется показать эффективность использования предложенного дескрипторного описания сигналов в сравнении с существующими (на основе получения мел-кепстральных коэффициентов, коэффициенвто локаьлно-полиномиальной аппроксимации и т.д.). Наилучшим эффектом будет являться получения дикторонезависимой  системы (в рамках заданных ограничений).  

 
Joomla templates by a4joomla