Команда «Голос!»: обзор голосовых сервисов
18.05.13Читайте в этой статье:
— Google Now
— Siri
— S-Voice
— Dragon Dictation и Dragon Search
Еще совсем недавно возможность голосового общения с компьютером была чем-то из разряда фантастики. Сегодня же сходу можно вспомнить множество сфер, где технологии распознавания речи применяются уже в полной мере. Например, в военной авиации такие системы устанавливаются на боевые истребители F-16, «Мираж», F-35 «Молния» и др. Также распознавание речи используется во многих современных автомобилях (правда, в основном премиум-сегмента) и для работы с навигационными сервисами, — Lexus, BMW, Mercedes—Benz и др. Да что там дорогие автомобили! Функции голосового управления (пока только для английских версий) есть в операционных системах Microsoft, начиная с Windows Vista (http://www.microsoft.com/enable/products/windowsvista/speech.aspx), а также Apple Mac OS X (http://www.apple.com/ru/accessibility/voiceover/).
Из разряда приятного дополнения распознавание речи все больше становится обязательной функцией для некоторых устройств. Например, компания Intel сделала наличие голосового управления новым условием для следующего поколения ультрабуков — . Но пока мы только ожидаем новое поколение ультрабуков, попробуем разобраться, какую из голосовых возможностей мы можем использовать уже сегодня в наших смартфонах и планшетах.
Голос всесильного поиска
Google Now
Функция голосового поиска была в мобильных сервисах Google уже давно. Теперь же (начиная с операционной системы Android 4.1) эти возможности интегрированы в некий персональный ассистент — Google Now. Приложение умеет искать ближайшие объекты (например, магазины или рестораны), показывать прогноз погоды, прокладывать маршрут в указанное вами место и кое-что другое. Максимум от этого сервиса могут получить активные пользователи сервисов Google и в частности Googl+, но другим пользователям он также будет небезынтересен. Сервис облачный, поэтому вам понадобится подключение к Интернету.
Нужно отдать должное Google Now: распознавание происходит очень хорошо. Осипший голос или дефекты речи — практически не проблема. А самое классное то, что распознаются более чем 25 языков, не считая десятка вариаций английского и испанского. Также хорошо распознаются и русский с украинским.
Единственное но: приложение полностью ориентировано на онлайновые сервисы и никак не взаимодействует с тем, что есть в вашем смартфоне.
Google Now
Разработчик: Google
Сайт: www.google.com/landing/now/
Доступна для Android 4.1+
+ большое количество поддерживаемых языков
+ агрегирует данные сервисов Google
— нет голосового управления смартфоном
Яблочная подруга
Siri
Сегодня, только ленивый не слышал про возможности голосовой помощницы «Сири». Владельцы яблочных устройств могут получить рекомендацию по заведениям, написать в социальную сеть, запускать приложения и даже заставить ее называть себя «Императором всея Руси». J
Как и многие проекты, Siri изначально была программным продуктом отдельно скачивающимся из Apple Store. А с 28 апреля 2010 года была куплена Apple. Затем разработчики доводили идею до совершенства, объединившись с исследователями из «Центра Искусственного Интеллекта» (SRI). Последний спонсировался DARPA, приложившей руку и к развитию Глобальной сети.
Из языков поддерживаются английский, испанский, итальянский, китайский, корейский, немецкий, французский и японский. Поскольку в концепции использовались слова «искусственный» и «интеллект», Siri не только применяет аппаратные механизмы для распознавания голоса, но и сохраняет речевые интонации. Поэтому со временем проблем с пониманием вашего вопроса будет становиться все меньше. Программа умеет не только отвечать на ваши поисковые запросы «где поесть?» или «куда сходить вечером?», но и управлять вашим яблочным смартфоном.
Сфера компетенции ограничивается как языками, так и географией. Siri может проложить маршрут или найти близлежащий объект только в США. Она использует для этого поисковую систему Yelp, полноценно доступную только там.
Siri
Автор: Siri Inc.
Разработчик: Apple Inc.
Сайт разработчика: www.apple.com/ios/siri
Доступна для iPhone 4S/5, iPad3/4/mini, iPod Touch 5
+ интегрирована в ОС
+ высокое качество распознавания текста
— ограниченные географией сервисы
Голос Samsung
S-Voice
Видео о том, как говорит S-Voice нового Samsung Galaxy SIV по-русски:
Примечательно, что, не дождавшись встроенной альтернативы Siri для Android, Samsung запустил собственный сервис, доступный, правда, только на ограниченных моделях устройств южнокорейского производителя. Речь идет о сервисе S—Voice, работающем на движке Vlingo (www.vlingo.com/), компании, совсем недавно объединившейся с Nuance — самым именитым разработчиком голосовых сервисов и не только.
«Девушка» S—Voice, в общем-то, похожа по характеру с «яблочной» помощницей. Занимается она тем же: дает рекомендации заведений, обновляет статусы в социальных сетях, прокладывает маршруты, следит за вашим календарем, запускает приложения и звонит названным контактам. Говорит она тоже почти на тех же языках — английском, испанском, итальянском, корейском, немецком, французском и с недавних пор — русском. А вот японцам и китайцам пообщаться со смартфоном на родных языках не получится. Пользователям наших широт придется общаться с ней пока только на русском языке и иметь в виду, что славянские фамилии и имена программа распознает на слух не очень хорошо. Легче уж найти контакт самому, чем объяснить программе, кого ты имеешь в виду. J Да, и этот сервис доступен далеко не всем владельцам смартфонов Samsung, а только обладателям Galaxy SIII, Note II, Note 10.1, SIII mini и Galaxy Stellar.
S-Voice
Платформа: Android 4.0
Автор: Samsung
Разработчик: Samsung
Сайт разработчика: www.samsung.com/global/galaxys3/svoice.html
Доступна для Samsung Galaxy SIII, Note II, Note 10.1 и SIII mini и Galaxy Stellar.
+ интегрирована в ОС
— поддержка небольшого количества языков
— поддержка ограниченого числа моделей устройств
Драконья речь
Dragon Dictation
Dragon Search
Еще одна попытка создать надежный и понятливый голосовой сервис от компании Nuance (www.nuance.com). В портфолио компании числятся бесспорно революционные ввод Т9 и swype-клавиатура. Первый был актуальным при вводе с кнопок на далеко еще не сенсорных телефонах, а вторая — для ввода без отрыва пальца от сенсорного экрана.
Dragon Dictation предназначена для ввода сообщений и последующей их отправки по SMS, Facebook или Twitter. Надиктованное сообщение можно сохранить как заметку. Распознавание речи — дело, бесспорно, тонкое. В настройках — 36 языков, в том числе русский и украинский. Ошибки в процессе распознавания встречаются редко, но звезд программа с неба не хватает. Пользоваться данным сервисом приемлемо, если у вас есть время отвлекаться на правку текста. Но безотказным этот вариант не будет, если пользоваться им за рулем.
Вторая программа — Dragon Search — является электронным помощником по поиску. Используя опять-таки голосовой ввод, она начнет искать по Сети сайты, фото, видео и отдельно на Youtube, Twitter и Wikipedia. Причем места поиска выбираются в удобной горизонтальной прокрутке.
Обе программы можно «поднатаскать», сразу исправляя неправильно распознанные слова. В дальнейшем они «привыкнут» к вашему произношению и ошибок будет меньше. Интуитивный и лаконичный интерфейс с необходимыми нам языками — явные плюсы. Ах да, пока что программы есть только на iOS, но разработчики обещают выпустить версии и для других платформ.
Dragon Dictation
Dragon Search
Разработчик: Nuance Mobile Solutions
Сайт разработчика: www.nuance.com
Адрес в Apple store:
Dragon Dictation www.itunes.apple.com/us/app/dragon-dictation/id341446764?mt=8
Dragon Search www.itunes.apple.com/ru/app/dragon-search/id341452950?mt=8
Оценка:
+ большое количество языков
+ бесплатная
— неточное распознавание речи
Подытоживая вышесказанное, мы отметим, что, с одной стороны, технологии, как и полагается, не стоят на месте. Если у вас нет возможности купить флагманский смартфон, скачайте приложение, которое «оживит» ваш аппарат. С другой стороны, сколько ни оживляй, но доведения до совершенства взаимопонимания с цифровым интеллектом нужно еще подождать. Тем более в вопросе распознавания родной речи, которой могут похвастаться пока только продукты Dragon. Однако не стоит унывать, раз за дело взялись такие гиганты, как Intel и Google.
Web-droid редактор
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Планшет Samsung Galaxy Tab S10 Ultra (SM-X926B): многое
Новый планшет Samsung Galaxy Tab S10 Ultra получил большой 14,6”-экран, топовый процессор Mediatek Dimensity 9300 и стилус S Pen. Попробуем разобраться для чего такой девайс
Xiaomi в 2025 году представит свой 3-нм чип для конкуренции с Qualcomm и MediaTek процессор смартфон
Предполагается, что первый 3-нм чип Xiaomi дебютирует в одном из флагманских смартфонов, возможно, в Xiaomi 16
ИИ Google Gemini получил поддержку голосовых команд в Spotify для поиска и воспроизведения музыки Google Spotify искусственный интеллект
Google совершенствует возможности голосового помощника Gemini, добавляя поддержку Spotify. Теперь пользователи могут искать, воспроизводить и просматривать музыку с помощью голосовых команд