The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Один из разработчиков Speex представил новый открытый голосовой кодек Codec 2

21.09.2010 13:08

Дэвид Рове (David Rowe), участвовавший в создании аудиокодека Speex, представил новый открытый кодек для передачи голоса по низкоскоростным каналам связи - Codec 2. В настоящее время выпущен первый альфа-выпуск нового кодека, в тестах показавший способность закодировать речь длительностью 3.75 секунд в 1050 байт (280 байт в секунду, для передачи достаточно канала 2550 бит/сек.), без потери разборчивости произнесенных фраз.

Изначально кодек был разработан для устройств любительской радиосвязи, в качестве альтернативы проприетарному протоколу D-STAR, тонкости которого держатся производителем в секрете. Основным назначением кодека является реализация идеи по обеспечению возможности организации цифрового канала связи для раций дециметрового диапазона, используя программный модем на основе обычной звуковой карты. Кодек также прекрасно подходит для различных устройств телефонии, используемых на каналах пропускной способностью ниже 5000 бит/сек.

Все наработки проекта распространяются под свободной лицензией LGPL. В настоящий момент подготовлены утилиты для кодирования, декодирования и симуляции уровня шума и влияния среды передачи сигнала. Заложенный в работу кодека алгоритм корнями упирается в публикацию 1984 года и не пересекается с какими-либо запатентованными технологиями. Для оценки качества закодированного голоса подготовлен набор примеров: исходный голос, голос после кодирования Codec 2 (2550 bit/s), голос после кодирования MELP (2400 bit/s).

В дальнейшем планируется реализовать в кодеке дополнительные средства сжатия, что позволит еще больше сократить минимальную полосу пропускания, доведя её до 2400 бит/сек. Для повышения качества речи планируется реализовать фильтры для подавления фонового шума и выделения голосовых гармоник. Завершающей фазой разработки станет перевод проекта на вычисления с фиксированной запятой и портирование кода для DSP-чипов.

  1. Главная ссылка к новости (http://www.rowetel.com/blog/?p...)
  2. OpenNews: Проект по созданию и стандартизации полностью свободного аудио-кодека
  3. OpenNews: Компания Skype открыла исходные тексты аудиокодека SILK
  4. OpenNews: Финальная версия официальной реализации свободного видеокодека Dirac
  5. OpenNews: Выпущен стабильный релиз свободного аудио-кодека Musepack SV8
  6. OpenNews: Компания Broadcom открыла голосовые кодеки под лицензией LGPL
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/28029-codec
Ключевые слова: codec, voice, audio
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (18) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, User294 (ok), 14:00, 21/09/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > алгоритм корнями упирается в публикацию 1980

    Да они все куда-то туда упираются, особенно "доставляют"  патенты на арифметическое кодирование и т.п. - янки бы еще числа запатентовали, чтоли. Чтоб уж наверняка.

     
     
  • 2.2, anonymous (??), 14:13, 21/09/2010 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Так наоборот написано, что эти алгоритмы никаких проблем с патентами не имеют. Ряды Фурье, к счастью, запатентовать не догадались.
     

  • 1.3, Аноним (-), 14:14, 21/09/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Все они одни местом навярняка упираются в работы математика Фурье.
     
     
  • 2.13, pavlinux (ok), 19:33, 21/09/2010 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Непрерывное преобразование Фурье эквивалентно двустороннему преобразованию Лапласа с комплексным аргументом
     

  • 1.4, mrvolk17 (ok), 14:22, 21/09/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Уж лучше запатентовать использование математики вообще.
     
  • 1.5, Андрей (??), 14:27, 21/09/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    а в астериск портируют?
     
     
  • 2.17, umbr (ok), 00:51, 22/09/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Если захотят, LGPL - удобная лицензия.
     

  • 1.6, igorsia (?), 15:52, 21/09/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • –3 +/
    скачанные образцы практически одинаковой длинны.
    где это суперсжатие или я чего то не понял
     
     
  • 2.7, Юрий (??), 16:02, 21/09/2010 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну вы же скачали в формате wav, а не codec 2
     
     
  • 3.12, астронимус (?), 17:54, 21/09/2010 [^] [^^] [^^^] [ответить]  
  • +/
    wav - контейнер. Кодеков может быть множество ADPCM, LPCM и т.д. Но идея понятна, зажатое кодеками аудио, обратно расжато до PCM
     
  • 2.9, Hety (??), 16:25, 21/09/2010 [^] [^^] [^^^] [ответить]  
  • +/
    У вас есть кодек? Нет. Посему данные были переведены в вав, чтобы вы могли оценить качество звучания ДО и ПОСЛЕ. Разница - потеря качества при перекодировании.
     
  • 2.14, User294 (ok), 20:45, 21/09/2010 [^] [^^] [^^^] [ответить]  
  • +/
    >где это суперсжатие или я чего то не понял

    Вы не поняли того что это исходный образец и сжатая и потом расжатая версия. Размер, разумеется, примерно как у оригинала :). Такой финт ушами позволяет любому желающему оценить результат декодирования низкоскоростного кодека обратно в поток годный для вывода в аудиокарту или куда там еще не обладая этим кодеком. Потому что если вам отсыпать данных в сжатом формате - что вы с ними делать то будете? Резко побежите компилить кодек для их декомпрессии? :) А сколько еще % юзеров все это осилит? :)

     

  • 1.10, sybasesql (ok), 16:35, 21/09/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    в cooledit не смотрел, не скажу, но на слух очень даже не плохо.
    если допилят и будет на 2400 работать, то можно на edge спокойно по сипу раздавать.
     
     
  • 2.15, User294 (ok), 20:48, 21/09/2010 [^] [^^] [^^^] [ответить]  
  • +1 +/
    EDGE (если вы о наследнике GSM+GPRS) выжимает намного больше чем 2400 bps. Проблема только в том что он может взять да и прервать потом данных секунд на пять. Не говоря о аццких пингах порядка 1-2 а то и более секунд, делающих разговор по VoIP больше похожим на разговор по рации :).
     

  • 1.16, umbr (ok), 00:48, 22/09/2010 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А у меня есть исходники MELP-a :)
     
     
  • 2.18, User294 (ok), 18:22, 23/09/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Ну есть. А такое уж ли это счастье? Во первых поюзать их без получения воздаяния или каких-то проблем можно только очень маломасштабно/полуприватно. Во вторых, в мире есть немало более свободных по лицензированию кодеков которые зачастую подойдут по параметрам (ультранизкие скорости - очень нишевая штука, в том же VoIP народ нынче качество желает, а чуть более высокобитрейтных кодеков с сырцами и без роялтей нынче уже как бы есть).
     
     
  • 3.19, umbr (ok), 18:46, 23/09/2010 [^] [^^] [^^^] [ответить]  
  • +/
    Когда его скачал, на тот момент, лицензия гласила что можно использовать в некоммерческих целях ;-)
     

  • 1.21, Аноним (21), 13:57, 29/08/2015 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Где Win32 билд?
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру