The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]



"Facebook опубликовал звуковой кодек EnCodec, использующий машинное обучение"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Facebook опубликовал звуковой кодек EnCodec, использующий машинное обучение"  +/
Сообщение от opennews (??), 02-Ноя-22, 17:22 
Компания Facebook (запрещена в РФ) представила новый звуковой кодек EnCodec, использующий методы машинного обучения для повышения степени сжатия без потери качества. Кодек может применять как для потоковой передачи звука в режиме реального времени, так и для кодирования для последующего сохранения в файлах. Эталонная реализация EnCodec написана на языке Python с использованием фреймворка  PyTorch  и распространяется под лицензией CC BY-NC 4.0 (Creative Commons Attribution-NonCommercial), допускающей использование только в некоммерческих целях...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=58029

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


7. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  –2 +/
Сообщение от Аноним (7), 02-Ноя-22, 17:40 
Ни один человек, если он хотя бы имеет IQ как у хлебушка, не станет внедрять в качестве кодека ту *****, которую сможет распутать только неизвестно как обученный и устроенный внутри ИИ

Традиционные кодеки практичны, надёжны и работают по очевидному алгоритму на всех этапах который легко воспроизвести с нуля

Ответить | Правка | Наверх | Cообщить модератору

15. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +13 +/
Сообщение от topin89 (ok), 02-Ноя-22, 18:06 
Я понимаю ощущения, но думаю дело в хайпе нейронок vs классические методы. Вот возьмём JPG обычный. Там внутре есть матрица квантования (умно звучит, но там просто целочисленно делят поэлементно), и подобрали её те же нейронки, только биологические. Хотя могли и полным перебором, и машинным обучением и как угодно ещё.

Даже банальная конверсия цветного изображения в чб основана на непонятных магических коэффициентах, собраных когда-то давно буквально на глазок.

Лично помню случай, когда портативный Blender был сначала сжать через ZIP, потом 7Z -- и это сработало вопреки всему, и не предскажешь такое, хоть и нет там нейронок.

В нейронках как раз архитектура простая, но коэффициентов не 5-100, а >9000. И то, что подбирали их через машинное обучение, а не наугад -- детали.

Сами по себе натренированные нейронки работают предсказуемо, и если 10 раз подать на вход один и тот же файл, 10 раз на выходе будет один и тот же результат. Только подбор коэффициентов случаен.

Ответить | Правка | Наверх | Cообщить модератору

32. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (32), 02-Ноя-22, 19:01 
У тебя всё в кашу перемешалось. Что касается "цветного изображения в чб", дак это только для тебя магия, а для остальных - коэффициенты вытекают из чувствительности глаза к разным цветам.
Ответить | Правка | Наверх | Cообщить модератору

64. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +9 +/
Сообщение от kai3341 (ok), 03-Ноя-22, 02:38 
> коэффициенты вытекают из чувствительности глаза к разным цветам.

Очевидно, этот глаз хранится в Бюро Мер и Весов. Хочешь сказать, все люди воспринимают цвета одинаково?

Ответить | Правка | Наверх | Cообщить модератору

72. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (72), 03-Ноя-22, 09:21 
Усредняют. Правда, некоторая дельта есть - потому и модели разные.
Ответить | Правка | Наверх | Cообщить модератору

28. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +3 +/
Сообщение от Аноним (28), 02-Ноя-22, 18:51 
> работают по очевидному алгоритму на всех этапах

Экспертиза уровня опеннет. Открой исходники любого кодека и почитай. Ротом расскажешь об «очевидных алгоритмах».

Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

84. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от муу (?), 04-Ноя-22, 12:13 
> Экспертиза уровня опеннет

ну если для тебя они не очевидны вали учить математику с физикой, эксперт уровня "ответы mail.ru" ты наш

Ответить | Правка | Наверх | Cообщить модератору

89. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от topin89 (ok), 06-Ноя-22, 22:31 
> ну если для тебя они не очевидны вали учить математику с физикой,
> эксперт уровня "ответы mail.ru" ты наш

То-то и оно, математика нейронок проще, чем математика условных AV1 или OGG.

Ответить | Правка | Наверх | Cообщить модератору

53. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Аноним (53), 02-Ноя-22, 21:51 
Ты ошибаешьшься. Если кодек - lossless, то ничего не мешает при улучшении моделей перекодировать на новые. То есть фейсбук выпустила кодек, и его сразу можно использовать. Все перекодировали все свои песни на этот кодек, сэкономили место на своих телефонах. PROFIT. А заинтересованные лица улучшают нейронку потихоньку. Питорч кстати тормознутое говно дли инференса, лучше ONNX Runtime ничего нет, даже Apache TVM после 1,5 часовой оптимизации модели что для CPU, что для Vulkan поверх AMDGPU у него сосёт (модель MobileViT, причём ONNX Runtime готов к использованию сразу, без всяких 1.5 часовых оптимизаций и компиляций в машинный код).

Потом заинтересованные лица наконец улучшат модель, и .... телефон её скачает, и в фоне перекодирует всю музыку. И свободного места ещё прибавится, "самим собой", просто за счёт улучшерия модели. Освобождённое место можно забить записанным вашим трёпом, который переслать Фейсбуку, на нём натренеруют новую модель, которая будет жать ещё лучше...

Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

70. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Diozan (ok), 03-Ноя-22, 08:45 
>>>Традиционные кодеки практичны, надёжны и работают по очевидному алгоритму на всех этапах который легко воспроизвести с нуля

Вот только режут звук со сложным спектром, ибо не обучены вычленять звук бас-гитары или вокала или скрипки из общего потока. И как результат, например, тарелочки не звенят, а цыкают, а из состава симфонического оркестра просто тупо выпадают некоторые инструменты.

Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

77. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Аноним (77), 03-Ноя-22, 10:16 
Очередная модно-молодёжная нейронка, досочиняющая нёх на ходу, проблему не решит. Так что ходи лучше в филармонию и слушай вживую.
Ответить | Правка | Наверх | Cообщить модератору

90. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от topin89 (ok), 06-Ноя-22, 22:36 
> Очередная модно-молодёжная нейронка, досочиняющая нёх на ходу, проблему не решит. Так что
> ходи лучше в филармонию и слушай вживую.

Давно изучал как работают самые мощные сжимающие алгоритмы вроде PAQ. Там, внезапно, тоже нейронка, c 2005 года. Такие алгоритмы сжатия сначала получают предсказанный (сочинённый) результат, находят разницу между предсказанным и реальным, и её уже сжимают.

Ответить | Правка | Наверх | Cообщить модератору

8. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от pashev.ru (?), 02-Ноя-22, 17:40 
А линейная регрессия — это ведь тоже машинное обучение?
Ответить | Правка | Наверх | Cообщить модератору

38. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Онанистмус (?), 02-Ноя-22, 19:45 
Да. Это первое чему учат.
Ответить | Правка | Наверх | Cообщить модератору

57. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от _dz (?), 02-Ноя-22, 23:14 
Зависит от того, как считается. Если подбором параметров - да, если решается в явном виде - нет.
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

65. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  –1 +/
Сообщение от pashev.ru (?), 03-Ноя-22, 03:01 
Ты тут нам маркетинг не хулюгань!
Ответить | Правка | Наверх | Cообщить модератору

10. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от pashev.ru (?), 02-Ноя-22, 17:44 
Опять что-то типа речь—текст—речь?
Ответить | Правка | Наверх | Cообщить модератору

42. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (32), 02-Ноя-22, 19:59 
Словарь Эллочки-людоедки составлял 30 слов, но ими она могла выразить практически любую свою мысль.
Ответить | Правка | Наверх | Cообщить модератору

47. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +3 +/
Сообщение от Аноним (47), 02-Ноя-22, 21:02 
хватит и двух:
хохо, парниша!
Ответить | Правка | Наверх | Cообщить модератору

73. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +3 +/
Сообщение от гоквч (?), 03-Ноя-22, 09:39 
я есть Грут
Ответить | Правка | Наверх | Cообщить модератору

91. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (47), 07-Ноя-22, 01:29 
вижу 3
Ответить | Правка | Наверх | Cообщить модератору

56. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от X (?), 02-Ноя-22, 23:11 
Типа отправил музыку, получил акопеллу на выходе?
Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору

63. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (32), 03-Ноя-22, 00:47 
с нейросеткой возможно всё.
Ответить | Правка | Наверх | Cообщить модератору

79. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +3 +/
Сообщение от n00by (ok), 03-Ноя-22, 10:50 
Типа смотрим видосик, а там поют:

Денег мало, длинный шмель,
Ты в кибитку не ходи!

Ответить | Правка | К родителю #56 | Наверх | Cообщить модератору

19. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от annonn (?), 02-Ноя-22, 18:14 
(Не)удивительно читать подобное нытье.
Фейсбук сделал для себя какой-то алгоритм, который подходит под их задачи и ограничения.
Они решили поделиться результатом со всем миром.
Если тебе подходит - пользуйся на здоровье, если не подходит - не пользуйся.

Вроде весь опенсорс так работает.

Ответить | Правка | Наверх | Cообщить модератору

23. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +4 +/
Сообщение от Вы забыли заполнить поле Name (?), 02-Ноя-22, 18:34 
Это не нытье, а критика. Учитесь различать. Или все должны восхвалять проекты fb?
Ответить | Правка | Наверх | Cообщить модератору

26. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от annonn (?), 02-Ноя-22, 18:44 
Критику увидел только в паре сообщений - там где есть обоснования и примеры "почему это плохо"
А остальные просто ноют.
Ответить | Правка | Наверх | Cообщить модератору

59. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +3 +/
Сообщение от Аноним (59), 03-Ноя-22, 00:36 
И почему нельзя поныть?
Цензуришь, парниша
Ответить | Правка | Наверх | Cообщить модератору

30. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  –5 +/
Сообщение от Аноним (28), 02-Ноя-22, 18:55 
В очередной раз Фейсбук делает за день для опенсорса больше, чем весь опеннет вместе взятый за неделю. Ждём местную Си-элиту напрогать алгоритм лучше и быстрее. Время пошло.
Ответить | Правка | Наверх | Cообщить модератору

37. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от триммер (?), 02-Ноя-22, 19:37 
Лучше чем aptX все-равно не получится.
Лучше бы они над энергоэффективностью носимых устройств поработали.
И вцелом над носимыми устройствами. А то ведь кроме атомных часов ничего толком от них и нет...
Ответить | Правка | Наверх | Cообщить модератору

48. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Аноним (47), 02-Ноя-22, 21:08 
А что вы скажете на то, что дискриминация добралась уже до звуковых кодеков?! И куда только конгресс смотрит.
Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору

61. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  –1 +/
Сообщение от Марк Ц. (?), 03-Ноя-22, 00:38 
Хорошо лизнул, мне понравилось
Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору

39. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от YetAnotherOnanym (ok), 02-Ноя-22, 19:51 
> Дискриминатор улучшает качество генерируемых образцов (sample) с учётом модели человеческого слухового восприятия

Вот с этого момента, пожалуйста, поподробнее.

Ответить | Правка | Наверх | Cообщить модератору

41. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +3 +/
Сообщение от Аноним (32), 02-Ноя-22, 19:57 
читать надо так: мы выкинул большую часть информации.
Ответить | Правка | Наверх | Cообщить модератору

43. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от annonn (?), 02-Ноя-22, 20:45 
... то что "внезапно" происходит во всех алгоритмах сжатия с потерями
Ответить | Правка | Наверх | Cообщить модератору

40. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (40), 02-Ноя-22, 19:57 
Говорят, опенсорсят, чтобы при делении компании было проще передать код.
Ответить | Правка | Наверх | Cообщить модератору

45. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Вы забыли заполнить поле Name (?), 02-Ноя-22, 20:53 
Вполне может быть. Хотя основная задача - это найм и популяризация компании.
Ответить | Правка | Наверх | Cообщить модератору

44. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  –1 +/
Сообщение от Аноним (44), 02-Ноя-22, 20:52 
>> когда при использовании MP3 требуется полоса пропускания в 64 kbps, для передачи с тем же качеством в EnCodec достаточно 6 kbps

1) пруфы??
2) кто слушает мп3 в 64кбпс?

Ответить | Правка | Наверх | Cообщить модератору

50. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +2 +/
Сообщение от _kp (ok), 02-Ноя-22, 21:19 
Почему Вы таки думаете, что это для музыки? Для какого нибудь голосового чата в мобильном приложении вполне применимо же. И помимо мессенджеров есть еще и игры, где тоже нужен голосовой чат, не забивающий весь мобильный канал связи.
Ответить | Правка | Наверх | Cообщить модератору

51. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (44), 02-Ноя-22, 21:37 
так как 48 кгц - это двд аудио, а не сд.. а 24 кгц - это вообще дичь какая то.. у кого цап в такое может?
Ответить | Правка | Наверх | Cообщить модератору

69. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Судья из Калифорнии с опытом программирования (?), 03-Ноя-22, 08:37 
У кого цап не может, тот умеет в ресемплинг.
Ответить | Правка | Наверх | Cообщить модератору

80. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  –1 +/
Сообщение от Аноним (44), 03-Ноя-22, 11:13 
слово на википедии нашел новое? покажи ка как ды делаешь ресемплинг в 24кгц
Ответить | Правка | Наверх | Cообщить модератору

88. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от topin89 (ok), 06-Ноя-22, 18:41 
Берём исходные данные в 48 кГц и оставляем диапазон 0-12 кГц любыми фильтрами любого порядка, по вкусу. Забираем каждое второе измерение -- и всё.
На воспроизведении, вставляем каждый первый элемент как нулевой, второй из переданного аудио, снова фильтр на 0-12 кГц -- и на ЦАП 48 кГц. Элементарная же операция, серьёзно.
Ответить | Правка | Наверх | Cообщить модератору

81. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (44), 03-Ноя-22, 11:24 
после этого комента я окончательнл понял кто такие датасатанисты и на чем они своих моделей дрессируют
Ответить | Правка | К родителю #69 | Наверх | Cообщить модератору

66. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (66), 03-Ноя-22, 06:53 
> голосового чата в мобильном приложении

Это сейчас так называется?

Ответить | Правка | К родителю #50 | Наверх | Cообщить модератору

78. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от _kp (ok), 03-Ноя-22, 10:39 
>> голосового чата в мобильном приложении
> Это сейчас так называется?

Не понял вопрос?
Неужели не видели, во многих играх, что дети играют на смартфонах, есть голосовой канал, для общения.
Качества достойного аудиофилов, в этом случае не требуется, и мп3 64кбит хватило бы за глаза.

Ответить | Правка | Наверх | Cообщить модератору

46. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  –3 +/
Сообщение от Аноним (47), 02-Ноя-22, 21:00 
Почему у предпросмотра видео в ютубе закруглённые углы, а когда переходишь на полный просмотр, углы квадратные?!!! Сделайте закруглённые углы при просмотре видео ужо!
Ответить | Правка | Наверх | Cообщить модератору

49. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от BrainFucker (ok), 02-Ноя-22, 21:17 
> по сравнению с форматом MP3

Они специально сравнивают с морально устаревшим кодеком? Было бы интересней посмотреть сравнение с opus, например.

Ответить | Правка | Наверх | Cообщить модератору

54. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от Аноним (53), 02-Ноя-22, 21:52 
Сравнивать надо с flac.
Ответить | Правка | Наверх | Cообщить модератору

55. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  –1 +/
Сообщение от BrainFucker (ok), 02-Ноя-22, 22:00 
> Сравнивать надо с flac.

С винилом. Или хотя бы с SACD.

Ответить | Правка | Наверх | Cообщить модератору

52. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +2 +/
Сообщение от Аноним (53), 02-Ноя-22, 21:40 
>Каузальная модель

Видимо слово "причинность" авторам статьи незнакомо. Как и ретропричинность.

Ответить | Правка | Наверх | Cообщить модератору

62. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +2 +/
Сообщение от Марк Ц. (?), 03-Ноя-22, 00:40 
Ага, всё время читаю как "казуальная"
Кто выдал этую тупую кальку, запихните её себе обратно
Ответить | Правка | Наверх | Cообщить модератору

58. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +3 +/
Сообщение от Аноним (58), 03-Ноя-22, 00:32 
> (вычисления, ... производятся на одном ядре CPU)

Не смогли распараллелить - представили как фичу

Ответить | Правка | Наверх | Cообщить модератору

67. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от КО (?), 03-Ноя-22, 07:11 
Эх если б можно было бы в прямой трансляции битрейт выбирать
Ответить | Правка | Наверх | Cообщить модератору

68. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +/
Сообщение от ryoken (ok), 03-Ноя-22, 07:54 
Чёто господа проприетарщики прям по очереди всякие кодеки публикуют. Недавно гугло свой выдавал, теперь эти. Кто следущий, интересно? :)
Ответить | Правка | Наверх | Cообщить модератору

76. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Аноним (76), 03-Ноя-22, 10:11 
Ага, давайте при наличии speex, iLBC, gsm, g723 и g729, которые прекрасно работают не первое десятилетие на "узких" каналах внедрять очередную AI/ML bloatware фитчу, которая будет впустую жрать cpu на конечных устройствах и корежить звук не по предсказуемым алгоритмам, а по тому как человеческий голос воспринимают разработчики из meta (запрещена в рф).
Ответить | Правка | Наверх | Cообщить модератору

82. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +2 +/
Сообщение от pavlinux (ok), 03-Ноя-22, 14:54 
> методы машинного обучения

Давно метод перебора и частотные выборки стали "машинным обучением"?

Ответить | Правка | Наверх | Cообщить модератору

83. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Аноним (32), 03-Ноя-22, 19:32 
> Давно

Примерно как только начали в вузах изучать Искусственного Идиота.

Ответить | Правка | Наверх | Cообщить модератору

85. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Аноним (85), 04-Ноя-22, 23:05 
Не перебора, а градиентного спуска. Понимать надо.
Ответить | Правка | К родителю #82 | Наверх | Cообщить модератору

86. "Facebook опубликовал звуковой кодек EnCodec, использующий ма..."  +1 +/
Сообщение от Аноним (32), 04-Ноя-22, 23:57 
Градиентный спуск - одна из самых убогих аналитических схем. Есть даже тривиальные поверхности, на которых градиенты по осям - нули, но стоит повернуть СК на 45 градусов, и сразу появляется этот градиент (речь про седло, например). Такая системокоординаточувствительность в реальных задачах делает много подлянок.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру