The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

/ Для пользователя / Звук
·25.09.2022 Открыт код системы распознавания и перевода речи Whisper (50 +15)
  Проект OpenAI, занимающийся развитием общедоступных проектов в области искусственного интеллекта, опубликовал наработки, связанные с системой распознавания речи Whisper. Утверждается, что для речи на английском языке система обеспечивает уровни надёжности и точности автоматического распознавания близкие к распознаванию человеком. Открыты код эталонной реализации на базе фреймворка PyTorch и набор уже обученных моделей, готовых для использования. Код открыт под лицензией MIT...
·23.09.2022 Выпуск звукового редактора Audacity 3.2 (42 +20)
  Опубликован релиз свободного редактора звука Audacity 3.2, предоставляющего средства для редактирования звуковых файлов (Ogg Vorbis, FLAC, MP3 и WAV), записи и оцифровки звука, изменения параметров звукового файла, наложения треков и применения эффектов (например, подавление шума, изменение темпа и тона). Audacity 3.2 стал вторым значительный выпуском, сформированным после перехода проекта в руки компании Muse Group. Код Audacity распространяется под лицензией GPLv3, бинарные сборки доступны для Linux, Windows и macOS...
·10.09.2022 Опубликован свободный звуковой кодек FLAC 1.4 (186 +50)
  Спустя девять лет с момента публикации прошлой значительной ветки сообщество Xiph.Org представило новую версию свободного кодека FLAC 1.4.0, обеспечивающего кодирование звука без потери качества. FLAC использует только методы кодирования без отбрасывания данных (lossless), что гарантирует полную сохранность изначального качества звукового потока и его идентичность с эталонным вариантом, подвергнутым кодированию. При этом используемые методы сжатия без потерь позволяют уменьшить размер исходного звукового потока на 50-60%. FLAC является полностью свободным потоковым форматом, подразумевающим не только открытость библиотек с реализацией функций кодирования и декодирования, но и отсутствие ограничений по использованию спецификаций и созданию производных вариантов. Код библиотек распространяется под лицензией BSD...
·23.07.2022 Выпуск мультимедиа-пакета FFmpeg 5.1 (92 +33)
  После шести месяцев разработки доступен мультимедиа-пакет FFmpeg 5.1, включающий набор приложений и коллекцию библиотек для операций над различными мультимедиа-форматами (запись, преобразование и декодирование звуковых и видеоформатов). Пакет распространяется под лицензиями LGPL и GPL, разработка FFmpeg ведётся смежно с проектом MPlayer...
·11.07.2022 Выпуск музыкального проигрывателя Audacious 4.2 (180 +23)
  Представлен релиз легковесного музыкального проигрывателя Audacious 4.2, ответвившегося в своё время от проекта Beep Media Player (BMP), являющегося форком классического плеера XMMS. Выпуск поставляется с двумя интерфейсами пользователя: на основе GTK и Qt. Сборки подготовлены для различных дистрибутивов Linux и для Windows...
·03.07.2022 Доступен Sound Open Firmware 2.2, набор открытых прошивок к DSP-чипам (10 +17)
  Опубликован выпуск проекта Sound Open Firmware 2.2 (SOF), изначально созданного компанией Intel для ухода от практики поставки закрытых прошивок для DSP-чипов, связанных с обработкой звука. Впоследствии проект был переведён под крыло организации Linux Foundation и теперь разрабатывается с привлечением сообщества и при участии компаний AMD, Google и NXP. Проектом развивается SDK для упрощения разработки прошивок, звуковой драйвер для ядра Linux и набор готовых прошивок для различных DSP-чипов, для которых в том числе формируются бинарные сборки, заверенные цифровой подписью. Код прошивок написан на языке Си с ассемблерными вставками и распространяется под лицензией BSD...
·14.06.2022 Представлен Floppotron 3.0, музыкальный инструмент из дисководов, дисков и сканеров (78 +49)
  Павел Задрожняк (Paweł Zadrożniak) представил третью редакцию электронного оркестра Floppotron, генерирующего звук при помощи 512 накопителей на гибких магнитных дисках, 4 сканеров и 16 жёстких дисков. Источником звука в системе является контролируемый шум, издаваемый при перемещении магнитных головок шаговым двигателем, щелчках головок жёстких дисков и движении каретки сканеров...
·29.05.2022 Выпуск звукового сервера PulseAudio 16.0 (213 +1)
  Представлен релиз звукового сервера PulseAudio 16.0, который выступает в роли посредника между приложениями и различными низкоуровневыми звуковыми подсистемами, абстрагируя работу с оборудованием. PulseAudio позволяет управлять громкостью и смешиванием звука на уровне отдельных приложений, организовывать поступление, смешивание и вывод звука при наличии нескольких входных и выходных каналов или звуковых карт, позволяет на лету менять формат звукового потока и использовать плагины, дает возможность прозрачно перенаправлять звуковой поток на другую машину. Код PulseAudio распространяется в рамках лицензии LGPL 2.1+. Поддерживается работа в Linux, Solaris, FreeBSD, OpenBSD, DragonFlyBSD, NetBSD, macOS и Windows...
·21.05.2022 Ubuntu 22.10 перейдёт на обработку звука при помощи PipeWire вместо PulseAudio (251 +30)
  В репозитории, в котором ведётся разработка выпуска Ubuntu 22.10, произведён переход на использование по умолчанию мультимедийного сервера PipeWire для обработки звука. Пакеты, связанные с PulseAudio удалены из наборов desktop и desktop-minimal, а для обеспечения совместимости вместо библиотек для взаимодействия с PulseAudio добавлена работающая поверх PipeWire прослойка pipewire-pulse, которая позволяет сохранить работу всех существующих клиентов PulseAudio...
·17.05.2022 Выпуски музыкального проигрывателя Qmmp 1.6.0 и 2.1.0 (128 +27)
  Опубликован выпуск минималистичного аудиоплеера Qmmp 1.6.0, а также версии Qmmp 2.1, которая продолжает развитие ветки, перешедшей на Qt 6. Одновременно сформированы коллекции плагинов, не входящих в основной состав - Qmmp Plugin Pack 1.6.0 и 2.1.0. Код проекта распространяется под лицензией GPLv2...
·13.05.2022 Новая версия музыкального проигрывателя DeaDBeeF 1.9.0 (337 –319)
  Доступен релиз музыкального плеера DeaDBeeF 1.9.0. Плеер написан на языке Си и может работать с минимальным набором зависимостей. Код распространяется под лицензией Zlib. Интерфейс построен с использованием библиотеки GTK, поддерживает вкладки и может расширяться через виджеты и плагины...
·28.04.2022 Обновление голосовых данных Mozilla Common Voice 9.0 (20 +7)
  Компания Mozilla представила обновление наборов голосовых данных Common Voice, включающих примеры произношения около 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи...
·22.04.2022 Новый выпуск системы синтеза речи Silero (25 +22)
  Доступен новый публичный выпуск нейросетевой системы синтеза речи Silero Text-to-Speech. Проект в первую очередь нацелен на создание современной высококачественной системы синтеза речи, не уступающей коммерческим решениям от корпораций и доступной для всех желающих без использования дорогого серверного оборудования...
·11.04.2022 Выпуск синтезатора речи RHVoice 1.8.0 (59 +30)
  Состоялся выпуск открытой системы синтеза речи RHVoice 1.8.0, изначально развивавшейся для обеспечения качественной поддержки русского языка, но затем адаптированной и для других языков, включая английский, португальский, украинский, киргизский, татарский и грузинский. Код написан на С++ и распространяется под лицензией LGPL 2.1. Поддерживается работа в GNU/Linux, Windows и Android. Программа совместима с типовыми TTS-интерфейсами (text-to-speech) для преобразования текста в речь: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) и Android Text-To-Speech API, но также может использоваться в экранном ридере NVDA. Создателем и основным разработчиком RHVoice является Ольга Яковлева, которая развивает проект несмотря на полную слепоту...
·28.03.2022 Выпуск библиотеки SDL_sound 2.0 (32 +9)
  Спустя 14 лет с момента прошлого выпуска сформирован релиз библиотеки SDL_sound 2.0.1 (выпуск 2.0.0 был пропущен), предоставляющей надстройку над библиотекой SDL c функциями для декодирования популярных звуковых форматов файлов, таких как MP3, WAV, OGG, FLAC, AIFF, VOC, MOD, MID и AU. Значительное изменение номера версии связано с переводом кода с копилефт лицензии LGPLv2 на пермиссивную лицензию zlib, совместимую с GPL. Кроме того, несмотря на сохранение обратной совместимости на уровне API, работа SDL_sound теперь возможна только на базе ветки SDL 2.0 (поддержка сборки поверх SDL 1.2 прекращена)...
Следующая страница (раньше) >>



Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру