Математическую модель распознавания речи, превосходящую аналоги по отдельным параметрам в несколько раз, создали ученые ТУСУРа. По их словам, разработка может стать основой комплексной системы цифровой идентификации личности, а также позволит легче управлять "умной" техникой с помощью голоса. Об этом сообщил Проектный офис "Приоритет 2030" ТУСУР.
Определение личности по голосу с помощью распознавания речи – активно развивающийся подход к цифровой безопасности, применяемый при управлении техникой и в системах безопасности банковских сервисов дистанционного обслуживания, сообщили специалисты.
Ученые Томского государственного университета систем управления и радиоэлектроники (ТУСУР) разработали новую математическую модель распознавания речи, превосходящую аналоги по точности и позволяющую корректно идентифицировать говорящего.
"Наш математический аппарат отличается от аналогов детальным соответствием устройству внутреннего уха человека при распознавании критических частот речи. Вероятностные механизмы, на которых построены существующие системы распознавания речи, у нас играют только вспомогательную роль", – рассказал заместитель директора ЦК НТИ "Технологии доверенного взаимодействия" ТУСУР Антон Конев.
По словам ученых, погрешность при распознавании основного тона речи у новой системы в четыре раза меньше, чем у лучших мировых аналогов. Это позволяет разработке намного лучше справляться с распознаванием обычной спонтанной речи или даже пения.
Как объяснили создатели, эта возможность поможет, например, общаться с "умными" системами не с помощью формальных команд, а почти так же, как с обычным живым собеседником.
"Наша разработка особенно эффективна при распознавании различных аббревиатур, редко встречающихся слов и фраз. Отдельное направление – выделение ключевых слов из речи, распознавание которых может стать заменой формальных команд при управлении "умной" техникой", – подчеркнул Конев.