The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Обновление голосовых данных Mozilla Common Voice 12.0

25.01.2023 09:21

Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи.

По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 23.8 до 25.8 тысяч часов речи. В подготовке материалов на английском языке приняли участие более 88 тысяч человек, надиктовавших 3161 час речи (было 84 тысячи участников и 3098 часов). Набор для белорусского языка охватывает 7903 участников и 1419 часов речевого материала (было - 6965 участников и 1217 часов), русского языка - 2815 участников и 229 часов (было 2731 участник и 215 часов), узбекского - 2092 участника и 262 часа (было 2025 участников и 258 часов), украинского языка - 780 участников и 87 часов (было 759 участников и 87 часов).

Проект Common Voice нацелен на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи без ограничений можно использовать в системах машинного обучения и в исследовательских проектах.

  1. Главная ссылка к новости (https://www.soeren-hentzschel....)
  2. OpenNews: Компания Mozilla представила движок распознавания речи DeepSpeech 0.9
  3. OpenNews: Обновление голосовых данных Mozilla Common Voice 9.0
  4. OpenNews: Новый выпуск системы синтеза речи Silero
  5. OpenNews: Открыт код Spleeter, системы для разделения музыки и голоса
  6. OpenNews: Mozilla тестирует систему голосового управления Firefox Voice
Лицензия: CC-BY
Тип: К сведению
Короткая ссылка: https://opennet.ru/58543-ommonvoice
Ключевые слова: ommonvoice, mozilla
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (22) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.4, Аноним (4), 10:29, 25/01/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > белорусского языка охватывает 7903 участников и 1419 часов
    > русского языка - 2815 участников и 229 часов

    И не надо мне рассказывать о количестве населения.

     
     
  • 2.6, Аноним (6), 10:42, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Выводы неверные делаете.
     
     
  • 3.11, Аноним (11), 12:32, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    А каких выводах вы говорите ?
    Я действительно не понимаю
     
  • 3.25, Анонус (?), 13:50, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Выводы очевидные. Качественных распознавалок русского языка на рынке предостаточно. Спрос на новые невелик. А вот носителям разных малых и исчезающих языков приходиться волонтерствовать, чтобы хоть немного улучшить ситуацию.

    // Из 229 часов русского - полчаса моих, если что.

     
     
  • 4.28, Аноним (28), 14:09, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > на рынке предостаточно

    а мне бы без рынка распознавалку

     
     
  • 5.29, Анонус (?), 14:14, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    >> на рынке предостаточно
    > а мне бы без рынка распознавалку
    > Vosk is a speech recognition toolkit. The best things in Vosk are:

    Supports 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish, Uzbek, Korean. More to come.

    Наглядная иллюстрация моего тезиса.

     

  • 1.7, Аноним (7), 11:27, 25/01/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >русского языка - 2815 участников и 229 часов (было 2731 участник и 215 часов)

    Бросятся ли местные эксперты-неалкаши заполнять базу данных? Или как всегда?

     
     
  • 2.16, Bob (??), 12:41, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • –2 +/
    строчить на opennet - максимум)
     
  • 2.41, nshmyrev (ok), 17:27, 28/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Лучше это дело стороной обходить.

    Сбор данных спонсируется USAID, вот например узбекам раздают подарки и собирают тусовки за голосовые данные

    https://uzbekvoice.ai/en-US/yangilik/8

    https://info.undp.org/docs/pdc/Documents/UZB/EF%20on%20Advancing

     

  • 1.8, Амомин (?), 11:28, 25/01/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Очень годный проект, стоит уделять свободную минутку хотя бы на отслушивание
     
  • 1.9, Аноним (7), 11:30, 25/01/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Но вообще страшно помогать роботам учиться.
    Потом меня уволят, а вместо меня посадят робота.
     
     
  • 2.10, Аноним (10), 11:52, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Женщину вынут, автомат засунут.
    Но вообще если вы хотите мне вместо робота делать text2speech, я не против.
     
     
  • 3.22, Аноним (28), 13:02, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    text2speech как раз попой ешь, вот в speech recognition абсолютно по нулям. всякие сфинксы а-ля прибей гвоздями в конфиге полторы команды - такое себе
     
     
  • 4.24, Аноним (10), 13:32, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Вот лучше бы большинство из голосовых движков попа и съела. Нормальных по пальцам пересчитать, а уж если оффлайн нужен, да ещё не английский, то вообще печально всё.
     
     
  • 5.40, nshmyrev (ok), 17:23, 28/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    https://github.com/rhasspy/larynx2

    Хороший современный движок синтеза. Пользуйтесь.

     

  • 1.12, Аноним (11), 12:35, 25/01/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Хм.. обидно и не понятно , почему так мало на русском
    Пойду попробую чуть помочь :)
     
     
  • 2.30, Аноним (28), 15:26, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > не понятно
    > Пойду попробую чуть помочь :)

    хочешь помочь - не мешай

     

  • 1.32, Аноним (32), 17:12, 25/01/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Хорошо, что выкладывают аудио, но где взять текст фраз, которые зачитываются? На сайте не нашёл, а без текста весь проект не имеет смысла.
     
     
  • 2.33, Аноним (33), 17:44, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    всё там есть, скачай датасет, внутри идут mp3 с голосом и файлы с текстом
     
     
  • 3.34, Аноним (32), 17:53, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Я скачал German - Common Voice Delta Segment 11.0, а там только mp3. Видимо, нужно качать Corpus. Но эти файлы жирные, а скорость скачивания у них режется до 1 Мбит/с. Если бы в torrent выложили, я бы повисел месяцок на раздаче.
     
     
  • 4.36, Аноним (33), 18:37, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    может зеркало неудачное получил, у меня скачивается со скорость ~5 Мбайт/с
     
     
  • 5.37, Аноним (32), 18:49, 25/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Да, или такой сервер попался, или из-за того, что браузером качал. Запустил арию, а она на полную катушку качает.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Спонсоры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2022 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру