Акустическое и языковое моделирование в сквозных системах распознавания речистатья из журнала
База данных: Каталог библиотеки СФУ (Ч-965)
Библиографическое описание: Чучупал, В. Я. Акустическое и языковое моделирование в сквозных системах распознавания речи / Чучупал В. Я. - Текст : непосредственный // Цифровая обработка сигналов. - 2020. - № 1. - С. 33-42 : ил. - Библиогр.: с. 42. - ISSN 2221-2574.
Аннотация: Сквозные (end-to-end) системы распознавания речи появились совсем недавно, но уже имеют показатели качества распознавания, сравнимые с лучшими продуктовыми системами, основанными на методах скрытых марковских цепей и глубоких нейросетей. Использование в сквозных системах распознавания однородных сетевых структур для акустического, произносительного и языкового моделирования, упрощение алгоритмов декодирования и замена экспертных знаний на оценки параметров, полученные методами машинного обучения, существенно редуцировало архитектуру систем распознавания речи. Наличие открытых инструментариев и корпусов данных значительно облегчило вход в эту научно-техническую область новым коллективам. Как плату за упрощение архитектуры систем распознавания можно рассматривать необходимость использования огромных, по привычным понятиям, корпусов данных для оценки параметров моделей. Сбор, аннотирование и обогащение аудио и текстовых данных стало отдельной и важной задачей. Отсутствие теоретических результатов, с помощью которых можно обосновать оптимальность выбора моделей или методов их обучения, приводит к появлению большого количества моделей, понимание причин эффективности которых не совсем очевидно. Тем не менее, уже имеющиеся результаты дают основание считать, что в ближайшее время эта технология станет общепринятой для построения систем распознавания речи.
Год издания: 2020
Авторы: Чучупал В. Я.
Источник: Цифровая обработка сигналов
Выпуск: № 1
Номера страниц: 33-42
Количество экземпляров:
- Читальный зал военных наук (Академгородок, 13А, к. 1-01): свободно 1 из 1 экземпляров
Ключевые слова: автоматическое распознавание речи, глубокие нейронные сети, сквозные системы распознавания, акустическое моделирование, модели языка
Рубрики: Радиоэлектроника,
Теория информации. Общая теория связи
Теория информации. Общая теория связи
ISSN: 2221-2574
Идентификаторы: полочный индекс Ч-965, шифр cios/2020/1-226868037