
Учёные из Санкт-Петербургского Федерального исследовательского
центра РАН обучили нейросеть навыку чтения по губам. Как сообщает
Чтобы точнее распознать речь человека, умная программа анализирует данные из двух источников и совмещает их. А обучили нейросетевую модель с помощью видео со звуком. Теперь она может воспринимать несколько сотен самых распространённых голосовых команд пользователей.
"Эксперименты показали, что такая гибридная система значительно эффективнее распознаёт команды человека в сложных и шумных условиях", — рассказывает старший научный сотрудник лаборатории речевых и многомодальных интерфейсов СПб ФИЦ РАН Денис Иванько.
Комментарии