Google сделает свой сервис по распознаванию речи открытым для разработчиков

Интернет

10:53 25.03.2016

На своей конференции NEXT по облачным платформам компания Google объявила открытой для разработчиков свою технологию по распознаванию речи Cloud Speech API.

Ранее Google использовал свои технологии распознавания речи лишь в своих продуктах и сервисах: Google app, Google keyboard и Google.com. Поэтому большинство разработчиков разных компаний обращались к единственному открытому сервису с данными технологиями от компании Nuance. Эта компания была выбором по умолчанию для многих брендов, и ее технологии на данный момент используются в Siri от Apple и S-Voice от Samsung, а также в интерфейсах авто BMW, Chrysler, Ford и других автопроизводителей.

Новый программный интерфейс компании Google принесет ее голосовые технологии в массы. Принцип действия этой системы состоит в следующем: голосовая команда посылается на облачный сервис и обратно в реальном времени, что включает выдачу результатов голосового ввода по частям. Распознанный голос можно использовать в качестве текста или для раздачи команд компьютеру.

Интерфейс от Google позволяет справляться с 80 разными языками и их вариантами, в то время как нынешний соперник от Nuance распознает лишь 38. Но так как интерфейс Cloud Speech является частью облачной платформы Google, возможно будет необходимо постоянное интернет-соединение.

Пока что Cloud Speech API доступно в бесплатной версии «ограниченного предпросмотра», которую можно попробовать лишь по приглашению. Для того чтобы попасть на тест, разработчики должны заполнить специальную форму и ожидать решения об их отборе. Google заявляет, что цены на полную версию будут объявлены на следующих стадиях разработки.

Похожие темы