Простое оффлайн распознавание голоса на Windows

Использование системы в различных ситуациях, вопросы программирования сценариев.

Модератор: immortal

Ответить
TbIKBA
Сообщения: 21
Зарегистрирован: Пн фев 29, 2016 10:21 pm

Простое оффлайн распознавание голоса на Windows

Сообщение TbIKBA »

Привет! У Microsoft есть своя платформа для распознавания голоса (которая используется в т.ч Kortana), называется Microsoft Speech Platform.

На ее основе сделана программа VoxCommando. Плюсы:
  • Распознает голос оффлайн
  • Есть возможность использовать фактор-слово для активации голосовой команды (программа ждет ключевое слово и выполняет только после его присутствия)
  • Довольно неплохо распознает
  • Легко интегрируется в Majordomo
Если у вас Win система, то как минимум стоит попробовать.
Очень подробная инструкция есть по этой ссылке, я устанавливал по ней дважды - https://www.youtube.com/watch?v=5od-SsxuiCw. Часть функционала программы платный, но стоит обратить внимание на архив под видео.

После установки стоит посмотреть видео с объяснением функционала - https://www.youtube.com/watch?v=2jIh0vrp3rA

Если кратко, то мы добавляем новое действие которое программа должна выполнить, и привязываем к нему фразы, которые мы для этого должны произнести.
Для интеграции с MD при добавлении действия я использовал функцию Scrape, она выполняет HTTP запрос. Соответственно, в первое поле пишем Scrape, во второе ссылку на нужный метод/сценарий.

Из моего опыта на текущий момент - сначала пробовал со стандартным микрофоном на ноутбуке и внешним дешевым Logithech микрофоном, все работает (при произнесении впритык). Сейчас купил активный микрофон Stelberry M-60, но столкнулся с проблемой - программа распознает в метре-полутора, по мере удаления почему-то перестает воспринимать звуковой сигнал, хотя проверял через наушники (и запись) - сигнал довольно сильный, голос читается четко. Может у кого-то есть опыт использования данного микрофона, если дело в нем - поделитесь пожалуйста. Как-то так, если будут вопросы - пишите.

Официальный сайт - voxcommando.com
Полная цена - 40$ (доступна бесплатная версия)
Bluefox
Сообщения: 9
Зарегистрирован: Пн авг 13, 2012 11:06 am

Re: Простое оффлайн распознавание голоса на Windows

Сообщение Bluefox »

Выглядит интересно. А может она передавать на URL распознанную фразу? С наскока не нашёл у них на сайте.
TbIKBA
Сообщения: 21
Зарегистрирован: Пн фев 29, 2016 10:21 pm

Re: Простое оффлайн распознавание голоса на Windows

Сообщение TbIKBA »

Да, можно использовать переменную LastSpoken
Аватара пользователя
Amarok
Сообщения: 1434
Зарегистрирован: Пт дек 14, 2012 12:24 pm
Откуда: Россия, Нижняя Тура
Контактная информация:

Re: Простое оффлайн распознавание голоса на Windows

Сообщение Amarok »

А для запуска в режиме ожидания пригодится ключ -standby
Моя Алиска живёт на Proxmox в Debian 12
Аватара пользователя
Amarok
Сообщения: 1434
Зарегистрирован: Пт дек 14, 2012 12:24 pm
Откуда: Россия, Нижняя Тура
Контактная информация:

Re: Простое оффлайн распознавание голоса на Windows

Сообщение Amarok »

TbIKBA писал(а):Для интеграции с MD при добавлении действия я использовал функцию Scrape, она выполняет HTTP запрос. Соответственно, в первое поле пишем Scrape, во второе ссылку на нужный метод/сценарий.
Можно пример скрин с правильным указанием?
Моя Алиска живёт на Proxmox в Debian 12
TbIKBA
Сообщения: 21
Зарегистрирован: Пн фев 29, 2016 10:21 pm

Re: Простое оффлайн распознавание голоса на Windows

Сообщение TbIKBA »

Amarok писал(а):Можно пример скрин с правильным указанием?
В правом поле ссылка на метод, включающий свет.

И, кстати, забыл написать! Для режима standby (ждать слово) можно задавать любое слово, соответственно, сохраняется ощущение, что мы продолжаем работать с Алисой
Вложения
vox.jpg
vox.jpg (84.09 КБ) 11255 просмотров
bat86
Сообщения: 80
Зарегистрирован: Пн ноя 30, 2015 10:20 pm

Re: Простое оффлайн распознавание голоса на Windows

Сообщение bat86 »

Что-то я не втыкаю как это настроить...
Хочу сделать так, Говорю Алиса, и например включить свет
Хочу отправить GET запрос http://127.0.0.1:8089/command.php?qry={LastSpoken}

Соответственно мне надо, чтобы на Алиса активировалось распознавание, а следующий текст отправлялся в команды.
Сейчас отправляется только Алиса.

Хочется воспользоваться уже готовыми шаблонами, а не городить всё по новой

Помогите как это реализовать?
lysyy
Сообщения: 113
Зарегистрирован: Вт июн 09, 2015 9:41 pm
Откуда: Moscow

Re: Простое оффлайн распознавание голоса на Windows

Сообщение lysyy »

Ребята, как автоматизировать установку программы, + залитие в настройки(реестр, ини, хз) паттернов комманд? иначе задолбаешься на каждом терминале тыкать кнопки
Ответить