Технология ИИ, разработанная Toshiba, позволит устройствам распознавать речь и узнавать пользователя без интернета

Компания Toshiba разработала технологию искусственного интеллекта, которая позволяет электронным устройствам быстро распознавать речь и выделять ключевые слова без необходимости подключения к интернету и обращения к облачным ресурсам для обработки данных.

К достоинствам новой технологии ИИ отнесена быстрота обучения и способность узнавать пользователя по голосу. Последнюю возможность можно использовать, чтобы бытовая техника реагировала на обращения к ней с учетом того, кто подает команды.

Технология имеет две основные особенности.

Первая особенность — использование промежуточных результатов во время определения ключевого слова для узнавания говорящего. Как утверждается, это позволяет уменьшить влияние окружающего шума и сократить время распознавания.

Вторая особенность — использование метода расширения данных в нейронной сети. При этом система использует входные данные для моделирования новых элементов речи. Этот прием позволяет уменьшить число образцов, необходимых для начального обучения при регистрации нового пользователя, всего до трех.

Сравнительная оценка, основанная на трех высказываниях каждого зарегистрированного пользователя, показала, что метод Toshiba обеспечивает точность идентификации 89%. Для сравнения: точность широко используемого метода узнавания говорящего i-vector находится на уровне 71%. Поскольку ожидается, что зарегистрированных пользователей бытовых приборов обычно будет не больше пяти или десяти, такой уровень точности считается достаточным.

Комментировать

Источник: ixbt.com/