The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Обновление голосовых данных Mozilla Common Voice 19.0

22.09.2024 13:02

Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 31.8 до 32.6 тысяч часов речи, из которых более 20 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 129 до 131.

В подготовке материалов на английском языке приняли участие 93.9 тысяч человек, надиктовавших 3587 часов речи (было 93.3 тысячи участников и 3554 часа). Набор для белорусского языка охватывает 8444 участников и 1846 часов речевого материала (было - 8400 участников и 1815 часов), русского языка - 3296 участников и 278 часов (был 3241 участник и 277 часов), узбекского - 2200 участников и 265 часов (было 2189 участников и 265 часов), украинского языка - 1104 участника и 114 часов (было 1091 участник и 113 часов).

Проект Common Voice нацелен на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи без ограничений можно использовать в системах машинного обучения и в исследовательских проектах.

  1. Главная ссылка к новости (https://www.soeren-hentzschel....)
  2. OpenNews: Обновление голосовых данных Mozilla Common Voice 18.0
  3. OpenNews: NVIDIA инвестирует 1.5 млн долларов в проект Mozilla Common Voice
  4. OpenNews: Новый выпуск системы синтеза речи Silero
  5. OpenNews: Опубликована AI-модель ChatTTS для синтеза речи
  6. OpenNews: Mozilla развивает инструментарий для распознавания речи Whisperfile
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/61911-voice
Ключевые слова: voice, ai
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (15) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 13:21, 22/09/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Отлично! Используем для обхода биометрический идентификации.
     
     
  • 2.18, Аноним (18), 15:52, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Как именно набор данных может быть использован для обхода, если там, где им реально нужно, стоит охранник с автоматом, чтобы таких обходильщиков ловить, а где не реально нужно - там вообще пофиг на ваши обходы, можете хоть белый шум пускать, хоть Digalo Nikolai юзать.
     
  • 2.34, Аноним (34), 19:07, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    С этим уже нейросетки намного лучше справляются.
     

  • 1.3, Аноним (3), 13:25, 22/09/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Помогать значит предлагают на халяву, а как попользоваться нужно будет тем же синтезатором речи, то в пролёте?!
     
     
  • 2.4, Аноним (4), 13:37, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Да все так не можешь сам синтезировать плати деньгу.
     
     
  • 3.12, Аноним (3), 13:52, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > Да все так не можешь сам синтезировать плати деньгу.

    Могли бы хотя бы аккаунтам кто внёс значительный вклад дать бесплатный доступ, в качестве оплаты за работу. Это было бы справедливо. А то иначе какой-то абуз халявных хомячков получается.

     
     
  • 4.35, Аноним (34), 19:08, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    И чем это плохо?) Зачем платить, если можно не платить? *Иудей.жпг*
     
  • 2.13, какая разница (?), 14:33, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > данные опубликованы как общественное достояние

    Где здесь хотя бы намёк на слово "деньги"?

     
     
  • 3.14, Аноним (14), 15:28, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Могли бы дать доступа к сервису кто не силен в мышином лернинге и у кого нет нвидиа 4090.

    С другой стороны все исходники Мозилла выложила после курсов по мышиному лернингу можно и свой сервис сделать. А можно и без них.    

     
     
  • 4.33, Аноним (33), 19:06, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Какому сервису, экспертик? Это библиотека сырых голосовых данных. Полностью открытая. Тот факт, что тебе непонятно, что именно она из себя предсталяет - не проблема Мозиллы.
     

  • 1.20, 12yoexpert (ok), 16:17, 22/09/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    ИЧСХ, в Белоруссии 99.9% населения говорит по-русски
     
     
  • 2.24, 12yoexpert (ok), 16:31, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >  Чым давядзеш?

    тем, что ты даже фразу "чем докажешь?" через google translate перевёл, закономерно получив бред

     
     
  • 3.31, Аноним (31), 18:33, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Логично ожидать, что ИИ будет эффективным в задаче машинного перевода. Однако это не так - результаты у всех удручающие.
     
  • 3.32, Аноним (31), 18:36, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Есть даже намерение убрать из своих программ машинные переводы на языки, которые не могу контролировать. Оставив только те, которые знаю - русский, английский и немецкий.
     
  • 2.30, Аноним (30), 17:00, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    В уа тоже.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру