The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Библиотека для распознавания русской речи на Android и Linux..., opennews (??), 11-Янв-20, (0) [смотреть все] +1

Сообщения [Сортировка по времени | RSS]


58. "Библиотека для распознавания русской речи на Android и Linux..."  +/
Сообщение от Аноним (58), 12-Янв-20, 00:59 
Почему именно 16 kHz в примере?

1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav` (48 kHz)

2. Заменил в примере 16000 на 48000

3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву

Ответить | Правка | Наверх | Cообщить модератору

60. "Библиотека для распознавания русской речи на Android и Linux..."  +1 +/
Сообщение от nshmyrev (ok), 12-Янв-20, 01:07 
> Почему именно 16 kHz в примере?
> 1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav`
> (48 kHz)
> 2. Заменил в примере 16000 на 48000
> 3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву

В исходниках там ожидается 16000, 48000 работать не будет, надо перекодировать. Можно `arecord -r 16000`, можно потом с помощью sox перекодировать.

Либо в исходниках исправить 16000 на KaldiRecognizer(model, 48000)

Ответить | Правка | Наверх | Cообщить модератору

61. "Библиотека для распознавания русской речи на Android и Linux..."  +1 +/
Сообщение от nshmyrev (ok), 12-Янв-20, 01:11 
>> Почему именно 16 kHz в примере?
>> 1. Пробовал записать wav файл с микрофона командой `arecord -vv -fdat test.wav`
>> (48 kHz)
>> 2. Заменил в примере 16000 на 48000
>> 3. Скормил wav-файл скрипту, в результате удалось распознать только одну букву
> В исходниках там ожидается 16000, 48000 работать не будет, надо перекодировать. Можно
> `arecord -r 16000`, можно потом с помощью sox перекодировать.
> Либо в исходниках исправить 16000 на KaldiRecognizer(model, 48000)

Ещё надо проконтролировать mono/stereo, стерео работать не будет.

Ответить | Правка | Наверх | Cообщить модератору

87. "Библиотека для распознавания русской речи на Android и Linux..."  +2 +/
Сообщение от Аноним (58), 12-Янв-20, 12:26 
Да, все получилось! Распознает достаточно точно, отличная либа.

p.s.: если стрипнуть `_vosk.so`, то можно сэкономить ~140mb (150mb -> 11mb)

Ответить | Правка | Наверх | Cообщить модератору

88. "Библиотека для распознавания русской речи на Android и Linux..."  +/
Сообщение от Аноним (58), 12-Янв-20, 12:35 
Хотя слово "тест" не хочет ни в какую распознавать.
Ответить | Правка | Наверх | Cообщить модератору

89. "Библиотека для распознавания русской речи на Android и Linux..."  +2 +/
Сообщение от nshmyrev (ok), 12-Янв-20, 12:46 
> Да, все получилось! Распознает достаточно точно, отличная либа.
> p.s.: если стрипнуть `_vosk.so`, то можно сэкономить ~140mb (150mb -> 11mb)

Отлично, да, в следующий раз добавлю strip в сборку.

Ответить | Правка | К родителю #87 | Наверх | Cообщить модератору

85. "Библиотека для распознавания русской речи на Android и Linux..."  +1 +/
Сообщение от Анонъ (?), 12-Янв-20, 11:25 
Наверно, потому что голосовой диапазон такой, когда-то и 4кГц было норм. Зачем грузить проц лишними данными.
Ответить | Правка | К родителю #58 | Наверх | Cообщить модератору

130. "Библиотека для распознавания русской речи на Android и Linux..."  +/
Сообщение от Аноним (-), 13-Янв-20, 06:53 
> Наверно, потому что голосовой диапазон такой, когда-то и 4кГц было норм.

Вообще-то 8. Потому что человеческий голос до примерно 4кГц. И то - с "телефонным" качеством. Это тех древних штук, где голос как из унитаза.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру