Распознавание CMU Sphinx требуется помощь

Обсуждение статей, технологий домашней автоматизации, программных и аппаратных решений
Alex_Jet
Сообщения: 1251
Зарегистрирован: 12 янв 2014, 18:00
Откуда: Россия, г.Томск

Re: Распознавание CMU Sphinx требуется помощь

Сообщение Alex_Jet » 04 сен 2018, 13:14

drhellp писал(а):
04 сен 2018, 12:09
Вообще файл грамматики как-то плохо работает или надо попробовать в словаре написать "Степановнатыздесь" одним словом.
Я пробовал. Было немного лучше.
Но все очень зависит от аппаратной части - нужен чувствительный микрофон с АРУ и активным шумоподавлением, у которого можно выставить к тому же порог шумоподавления ниже которого микрофон не будет слышать.
После беседы с гуру распознавания (Николай Шмырев), пришел к выводу что без нормальных аппаратных возможностей с pocketsphinx_continuous (и pocketsphinx, который на java) будут всегда ложняки. Поэтому надо осваивать caldi. Присоединяйтесь к группе CMUSphinx Russia в Telegram.
Для меня легче сделать аппаратную часть...правда времени пока на это совсем нет.

drhellp
Сообщения: 7
Зарегистрирован: 03 сен 2018, 15:54

Re: Распознавание CMU Sphinx требуется помощь

Сообщение drhellp » 04 сен 2018, 13:34

Alex_Jet писал(а):
04 сен 2018, 13:14
Но все очень зависит от аппаратной части - нужен чувствительный микрофон...
Возможно.
Я положил микрофон и направил на него наушники. Пять минут роликов на youtube.

Код: Выделить всё

12:18:50 - степановна ты свет
12:18:55 - степановна ты свет наверанде
12:19:24 - степановна ты здесь везде
12:19:49 - степановна ты питание везде
12:21:00 - степановна ты здесь
12:21:16 - степановна ты свет вприхожей
12:21:44 - степановна ты питание
12:22:04 - степановна ты питание
12:22:28 - степановна ты свет везде
12:23:04 - степановна ты свет
12:23:45 - степановна ты здесь вгардеробной
Ложное распознавание сбрасывал в файл. Поэтому считаю нужно фильтровать команды. Не думаю что хорошая аппаратура здесь поможет. Мне кажется проще программно отфильтровать вывод.

Alex_Jet
Сообщения: 1251
Зарегистрирован: 12 янв 2014, 18:00
Откуда: Россия, г.Томск

Re: Распознавание CMU Sphinx требуется помощь

Сообщение Alex_Jet » 04 сен 2018, 14:12

drhellp писал(а):
04 сен 2018, 13:34
Ложное распознавание сбрасывал в файл. Поэтому считаю нужно фильтровать команды. Не думаю что хорошая аппаратура здесь поможет. Мне кажется проще программно отфильтровать вывод.
У вас реально мало ложных срабатываний! Надо попробовать ваш скрипт. У меня так руки и не дошли на php написать. Хотя я в нем нуб, но не так как в phyton...

Попробуйте еще сделать проще - включить телевизор, или открыть окно (у меня за ночь с открытым окном на мой переулок в центре города "Лиза" очень часто отвечала на команду "Лиза ты здесь") - в таком случае динамический диапазон всех звуков шире нежели чем в наушниках.

У вас "степановна ты здесь" - наиболее встречаемое распознавание, значит такую команду использовать не получится.

drhellp
Сообщения: 7
Зарегистрирован: 03 сен 2018, 15:54

Re: Распознавание CMU Sphinx требуется помощь

Сообщение drhellp » 04 сен 2018, 14:54

Alex_Jet писал(а):
04 сен 2018, 14:12
У вас реально мало ложных срабатываний!
Не так уж и мало, оставил послушать интервью с Путиным :) за сорок пять минут более 150 ложных распознаваний.
И около семи пролезло через фильтр, в основном "степановна ты здесь".
... у меня за окном лес :) ...

Alex_Jet
Сообщения: 1251
Зарегистрирован: 12 янв 2014, 18:00
Откуда: Россия, г.Томск

Re: Распознавание CMU Sphinx требуется помощь

Сообщение Alex_Jet » 04 сен 2018, 18:27

drhellp писал(а):
04 сен 2018, 14:54
Alex_Jet писал(а):
04 сен 2018, 14:12
У вас реально мало ложных срабатываний!
Не так уж и мало, оставил послушать интервью с Путиным :) за сорок пять минут более 150 ложных распознаваний.
И около семи пролезло через фильтр, в основном "степановна ты здесь".
... у меня за окном лес :) ...
Лес тоже шумит. Кроме этого, есть ветер, сквозняк через окно. Поэтому нужен микрофон с задаваемым порогом шумоподавления, узкой полосой и АРУ.

drhellp
Сообщения: 7
Зарегистрирован: 03 сен 2018, 15:54

Re: Распознавание CMU Sphinx требуется помощь

Сообщение drhellp » 04 сен 2018, 18:48

Какова цена вопроса?

sky
Сообщения: 16
Зарегистрирован: 15 апр 2011, 21:04

Re: Распознавание CMU Sphinx требуется помощь

Сообщение sky » 04 сен 2018, 19:02

Как вариант https://stelberry.ru/products/M90.html 3000 р.

Alex_Jet
Сообщения: 1251
Зарегистрирован: 12 янв 2014, 18:00
Откуда: Россия, г.Томск

Re: Распознавание CMU Sphinx требуется помощь

Сообщение Alex_Jet » 05 сен 2018, 08:47

drhellp писал(а):
04 сен 2018, 18:48
Какова цена вопроса?
Вообще цена вопроса не больше 1000 р. Но надо написать код для работы с аудиопроцессором. В телеграме есть чат Ass shield - там один энтузиаст разрабатывает "шилд" с обвязкой для разных одноплатных компьютеров. Обвязка включает в себя цифровые микрофоны, аудиопроцессор, маломощный усилитель НЧ (2х3Вт), RGB-светодиоды и т.д. Предназначение - создание умного ассистента типа голосового управления чем-либо. Но пока проект на уровне разработанных плат... То есть до опробования (написание нужного кода) работоспособности железки тестерами - еще долго!
sky писал(а):
04 сен 2018, 19:02
Как вариант https://stelberry.ru/products/M90.html 3000 р.
Штука классная, видно что есть нормальный аудиопроцессор, но для нашего случая нужно подключение к одноплатнику чтобы из вебки, например, можно было управлять всеми настройками. А не лазить под потолок чтобы поменять настройки...
В общем я хотел бы чтобы свет увидел тот самый "шилд" под Orange Pi Zero, например, который будет непосредственно управлять аудиопроцессором ADAU1772 с помощью кода, написанного пользователем.

drhellp
Сообщения: 7
Зарегистрирован: 03 сен 2018, 15:54

Re: Распознавание CMU Sphinx требуется помощь

Сообщение drhellp » 05 сен 2018, 16:15

Где-то видел, что можно от PS вот такой использовать https://ru.aliexpress.com/item/OOTDTY-s ... 86508.html и такой https://ru.aliexpress.com/item/Mini-USB ... 43543.html
Ещё вариант https://www.seeedstudio.com/ReSpeaker-M ... -2719.html

Alex_Jet
Сообщения: 1251
Зарегистрирован: 12 янв 2014, 18:00
Откуда: Россия, г.Томск

Re: Распознавание CMU Sphinx требуется помощь

Сообщение Alex_Jet » 06 сен 2018, 06:30

drhellp писал(а):
05 сен 2018, 16:15
Где-то видел, что можно от PS вот такой использовать https://ru.aliexpress.com/item/OOTDTY-s ... 86508.html и такой https://ru.aliexpress.com/item/Mini-USB ... 43543.html
Ещё вариант https://www.seeedstudio.com/ReSpeaker-M ... -2719.html
Да. Про камеру с массивом микрофонов от PS3 совсем забыл. Где-то был тест массивов микрофонов на англоязычном сайте и эта камера от PS3 показала лучшее качество распознавания голоса. По второму - отзывы плохие, либо никто не умеет настраивать софтовую чувствительность (к слову я покупал USB-настольный микрофон - при выкрученной на максимум чувствительности имел качество худшее чем с обычного конденсаторника на микрофонном входе Orange Pi Zero).
Про ReSpeaker и подобные вещи тоже знаю, но цена неоправданно высокая!!!

Микрофон, который покупал: https://ru.aliexpress.com/item/USB/3284 ... 33edDaY9Tv
Вот тест микрофонных массивов: https://medium.com/snips-ai/benchmarkin ... 0de8876fda

martiniman
Сообщения: 528
Зарегистрирован: 09 авг 2016, 15:09
Откуда: Сочи

Re: Распознавание CMU Sphinx требуется помощь

Сообщение martiniman » 06 сен 2018, 11:36

Уже нужно ставить Яндекс колонку (или дешевую мобилу с Алисой в режиме прослушки), разбирает даже детский голос и там есть открытый API https://aliceskill.ru/razrabotka-navykov-dlya-alisy/

Alex_Jet
Сообщения: 1251
Зарегистрирован: 12 янв 2014, 18:00
Откуда: Россия, г.Томск

Re: Распознавание CMU Sphinx требуется помощь

Сообщение Alex_Jet » 06 сен 2018, 12:40

Это конечно хорошо, но я из тех людей, кто предпочитает камеру в ноутбуке/телевизоре закрыть/заклеить. Поэтому он-лайн голосовые помощники мне не по душе - неизвестно какой контент собирает их производитель.

martiniman
Сообщения: 528
Зарегистрирован: 09 авг 2016, 15:09
Откуда: Сочи

Re: Распознавание CMU Sphinx требуется помощь

Сообщение martiniman » 06 сен 2018, 13:56

Alex_Jet писал(а):
06 сен 2018, 12:40
Это конечно хорошо, но я из тех людей, кто предпочитает камеру в ноутбуке/телевизоре закрыть/заклеить. Поэтому он-лайн голосовые помощники мне не по душе - неизвестно какой контент собирает их производитель.
Кстати, в презентации колонки они прямо показывали плату и кнопку отключения микрофона, и при нажатии на плате физически отключается микрофон (не программно).

drhellp
Сообщения: 7
Зарегистрирован: 03 сен 2018, 15:54

Re: Распознавание CMU Sphinx требуется помощь

Сообщение drhellp » 06 сен 2018, 14:55

martiniman писал(а):
06 сен 2018, 13:56
...кнопку отключения микрофона, и при нажатии на плате физически отключается микрофон (не программно).
:) я тоже параноик, переключатель или кнопка, которая подает сигнал на отключение? И ещё зависимость от интернет, скорость отклика. Нужно-то всего пару десятков команд распознать.
Вот тоже стоит задуматься :) https://twitter.com/CKonovalov/status/1 ... 0509847552

Ответить