Система распознавания речи Microsoft значительно улучшилась

microsoft-speech

 

Год назад группа ученых из Microsoft по речевым и диалоговым исследованиям улучшила свою систему распознавания речи, достигнув 5,9% коэффициента ошибок. Ранее это считалось средним значением для частоты ошибок самих людей, однако позднее было показано, что коэффициент в 5,1% больше подходит для людей, способных цитировать то, что было услышано в беседе.

 

Чтобы снизить частоту ошибок системы распознавания речи, исследователи из Microsoft включили ряд усовершенствований в свои акустические и языковые модели на основе нейронной сети. Помимо общих обновлений для всех компонентов системы, размер словаря коммутатора увеличили с 30 000 слов до 165 000.

 

Наиболее важным нововведением стала так называемая «долговременная память на основе сеанса диалога». Это означает, что новая языковая модель позволяет системе использовать весь предыдущий разговор как историю при попытке четко определить конкретные фразы. Другими словами, система намного быстрее понимает, что разговор идет, например, о спорте или политике, и находит подходящие под эту тему фразы.

 

«Мы работаем над обучением компьютеров, чтобы не просто расшифровывать сказанные слова, а также понимать их смысл, — пишет технический сотрудник Microsoft. — Переход от распознавания к пониманию речи — следующий важный рубеж для речевых технологий».

 

Системы распознавания речи Microsoft в настоящее время используются в таких сервисах, как Cortana и Speech Translator. Компания предоставила документ, в котором описаны особенности новой версии системы.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


Игровой руль Logitech G29 с педалями и коробкой: спорткар на столе Logitech G29 Driving Force Racing Wheel

Расскажем про игровой руль Logitech G29 для ПК и PlayStation, а также дополнение в виде 6-ступенчатой коробки скоростей Driving Force Shifter.


НовостиNews
| 13.37
Браузер Google Disco может создавать веб-приложения   
Google Disco

Google запустила экспериментальный браузер Disco в Chrome Search Labs, использующий генеративный ИИ не только для просмотра сайтов, но и создания интерактивных мини-приложений

| 10.08
Победители The Game Awards 2025 в 30 номинациях  
The Game Awards 2025

После того, как Clair Obscur: Expedition 33 получила главную награду «Игра года», церемония The Game Awards 2025 определила победителей и в десятках других категорий.