The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Анализ проблем с GPL у бизнес-модели Red Hat "
Отправлено Аноним, 28-Июн-23 02:43 
> Это очевидное следствие из алгоритмов сжатия.

Теория не может быть следствием из алгоритмов сжатия.

> Есть такое понятие - энтропия. Чем она выше, тем хуже файл сжимается.

Спасибо кэп. А таки в видео очень много избыточной информации. И даже современные кодеки на самом деле далеко не полностью устраняют ее. И все навороты кодеков как раз вокруг этого строятся.

> Классические алгоритмы, тот же LZW

Не надо мне рассказывать что я знаю, я даже кодил LZ unpacker'ы лично. Но раз вы такой умный вы можете рассказть как оценить энтропию "в этом мувике" для начала. Чтобы понять расстояние от теоретического предела. Более того - пойнт lossy сжатия в том что оно часть информации теряет, но человек это не замечает, или не очень замечает. Это несколько меняет правила игры.

> В сжатом файле энтропия всегда выше чем в исходном. Но энтропия не может увеличиваться
> до бесконечности.

И вы конечно же сформулируете какой-то осмысленный верхний предел, показав что он и правда близок к тому что есть?

А то насколько я вижу, современные кодеки как раз более-менее прокачали удаление избыточности и пришли к тому что опробование наилучших вариантов как это делать и их комбо требует неслабо так времени на кодирование при котором пытаются понять наилучшие из вариантов как кодировать. Вы же понимаете что есть много способов даже получить битовый поток дающий идентичный результат при декодировании. У LZ-like даже есть такое понятие как Optimal Parsing, но эта задача полностью и честно решаема только для самых тривиальных форматов типа LZ4. В более сложных и фичастых оптимальный парсинг вообще нереально сделать за разумное время. В лучшем случае бывает приблизительная эвристика. А уж современные форматы видеокодеков - заведомо в субоптимальном режиме кодируют, отбрасывая большую часть пространства поиска эвристикой, и даже так это очень медленно.

> В случано сгенерированной последовательности байтов энтропия максимальна.
> Поэтому текстовые файлы сжимаются хорошо, бинарные хуже,

Вообще-то все это сильно зависит от конкретики. Бывают весьма избычточные бинарные файлы, ничему не противоречит. Скажем чертеж или line art в картинке - бинарный массив пикселей, но большая часть оных может быть одинаковыми и даже отличия - массовыми повторами.

> Вот первая же ссылка нагуглилась: https://habr.com/ru/articles/181045/

Вопросы были более конкретные и предметные, про оценку энтропии в видео и как оценили близость. Нет, статьями для нубов не отделаетесь - я как раз в теме.

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру