На 27 конгрессе Chaos Communication (http://events.ccc.de/congress/2010/wiki/Main_Page) в Берлине эксперт по безопасности Джулия Вольф (Julia Wolf) рассказала (http://www.h-online.com/security/news/item/27C3-danger-lurks...) публике о новых ранее неизвестных рисках в безопасности, связанных с широко используемым форматом PDF, который используется для универсального обмена информацией.- PDF документ может содержать сканер БД, который начинает сканировать локальную сеть, когда PDF документ печатают на сетевом принтере.
- PDF документ может отображать разную информацию в зависимости от приложения, которое открывает документ, а также в зависимости от операционной системы, настроек локали и даже в зависимости от устройства отображения.
Были названы и ранее известные проблемы формата: PDF документы согласно спецификации являются контейнерами и могут содержать исполняемый JavaScript код, а также документы практически любого формата включая XML, Fla...URL: http://www.h-online.com/security/news/item/27C3-danger-lurks...
Новость: https://www.opennet.ru/opennews/art.shtml?num=29184
Пофиг, что можно запихнуть в PDF, если просмотрщики будут загружать и выполнять все это в песочнице. А как сейчас?
> Пофиг, что можно запихнуть в PDF, если просмотрщики будут загружать и выполнять
> все это в песочнице. А как сейчас?кстати, FoxIt эту фичу вроде бы имеет изкаробки и по-умолчанию
> кстати, FoxIt эту фичу ...откуда вы только про этот просмоторщик узнали? :-D :-D
например тут его даже нет в списке: http://www.pdfreaders.org/
А кому этот список недопросмотрощиков интересен ?
> кстати, FoxIt эту фичу вроде бы имеет изкаробки и по-умолчаниюАга, круто. Остается только придумать почему этот закрытый блоб должен вызывать больше доверия чем непонятные PDF документы. А, собственно, чем он принципиально лучше? Ведь проверить что там внутрь понапихано .... нельзя, даже если будет такое желание. Его самого как, тоже изолировать в виртуалочку? :).
Паранойя?
Реальность
> Реальностьxpdf, даже недавно найденные в нём "уязвимости" - весьма трудны к реализации. Непотопляемый виювер.
Один минус у него только - motif сильно устаревший тулкит
Один минус - годится только для просмотра. Для заполнения PDF-форм, которые любят иностранные банки и консульства, он непригоден.
Итого - два минуса.
Самые опасные риски содержатся в операционной системе. Она может выполнить любой код.
Птицы летают крыльями
> Птицы летают крыльямиНеправда. Далеко не все.
Всегда имел представления о файлах в формате PDF как о документах пригодных только просмотру-чтению и печати. Для чего нужны в PDF-файле видеоролики, zip-архивы и т.д. понять не могу.
> Всегда имел представления о файлах в формате PDF как о документах пригодных
> только просмотру-чтению и печати. Для чего нужны в PDF-файле видеоролики, zip-архивы
> и т.д. понять не могу.Например, для презентаций.
Есть более строгий формат PDF/A, там:
* Запрещён аудио и видео контент.
* Запрещено внедрение кода на javascript и команд на запуск исполняемых файлов.
* Все шрифты должны быть внедрены и также они должны быть легально внедряемы для неограниченного универсального отображения. Это так же касается и так называемых стандартных шрифтов Postscript, таких как Times или Helvetica.
* Цветовые пространства определяются независимым от устройства способом.
* Шифрование не разрешено.
* Предписывается использование основанных на стандартах метаданных.
(из Википедии)
> Всегда имел представления о файлах в формате PDF как о документах пригодных
> только просмотру-чтению и печати. Для чего нужны в PDF-файле видеоролики, zip-архивы
> и т.д. понять не могу.Очень просто можно исходники втыкать в документ в виде архивов.
PDF - это контейнер общего назначения, по крайней мере - в исполнении Adobe (там сложность полной спецификации такова, что больше никто не реализовал, кажется). Мой любимый пример - это формы для получения гражданства. Заполняешь, в отличие от введенного меняется набор полей, всё это сохраняется в документе (можно скопировать документ - данные скопируются вместе с ним) и по нажатии "Send" данные уходят на сервер.
Часто меняешь гражданство? Поздравляю.
Коммент "гениален".
Самое неприятное в этих кипах новостей про недостатки PDF - ни одной новости об альтернативном формате. Сколь угодно непопулярном, недоделанном, не одобренном комитетами - но хотя бы концептуально существующем. Ни одной...При том, что PostScript открыт, и алгоритмы сжатия не все запатентованы. Казалось бы - берем нужные библиотеки, кодируем формат. Берем еще библиотеки, собираем просмотровщик. Все - есть опенсорсный, однозначно выглядящий, без задних ходов, ни от кого не зависящий формат только для документов. При желании добавить в архив xml с описанием форм, а в плеер - возможность их заполнения, тоже не проблема. И электронную подпись. И прочую, уже существующую в открытых проектах, функциональность. Нет?
Что мы имеем: PDF - громоздкое, дырявое, направляемое алчной Adobe явление - но с этим, по большому счету, никто ничего сделать не может. Ставят заплатки на дыры - и все...
Для тех же док народ пользует дежавю.
Тупость маленько в другом - в CUPS как известно кто-то недоперепил и решил что PDF теперь при печати "рулит", хотя для большинства принтеров этот самый PDF всё равно транслируется в PostScript. Любят мыши есть кактусы.
У дежавю основная цель при создании, если не ошибаюсь - затруднение чтения его чем-либо, кроме глаз. По сути, это капча размером с документ. Поскольку потери качества только приветствуются, размер, конечно, выигрывает. Но для документооборота это не самая удачная концепция...
> По сути, это капча размером с документ.У djvu есть OCR слой. Или вы не об этом?
Ошибаетесь, "DjVu" предназаначен для распространения сосканированных документов, на полноценное распознавание/вычитку текстов которых пока нет средств.
Тогда странно выглядит существование DjVu-файлов с OCR-слоем, не правда ли? ;)
В любом случае, формат не предполагает того, чтобы в него мог экспортировать текст, например, LibreOffice.
PDF же незаменим в цепочке "набрал - передал - открыли именно то и так, как было набрано, независимо от".
Разве что печатать, сканировать и упаковывать в DjVu %(
>В любом случае, формат не предполагает того, чтобы в него мог экспортировать текст, например, LibreOffice.А с чего вы взяли, что это проблема формата, а не LibreOffice, например?
Я не считаю проблемой формата JPEG то, что в нем нельзя отправить музыку.
Но вы же согласитесь, что он для этого непригоден?
Так же и DjVu непригоден для той ниши, в которой царит PDF.
Во всяком случае, подходит для этого немногим больше, чем тот же JPEG.
обратите внимение на слово "полноценную". Так как текстовый слой не виден, некритично, если в нем мусор, не надо возиться с его форматированием, разбиением на страницы и т.д. Даже не вычитывать обынчо можно - если большая часть распозналась корректно, для поиска этого обычно хватает.
Ошибаетесь. Дежавю сделали для сканирования архивных документов. Когда важен сам раритетный вид, но надо сэкономить размер.
Помнится, что нонче за СUPS стоит Apple, а там даже для вывода на экран промежуточным форматом вроде как тот же PDF
>Самое неприятное в этих кипах новостей про недостатки PDF - ни одной новости об альтернативном формате. Сколь угодно непопулярном, недоделанном, не одобренном комитетами - но хотя бы концептуально существующем. Ни одной...А еще тут иногда появляются сообщения об уязвимостях в известных браузерах. И ни одного, ни одного сообщения об альтернативах для HMTL/CSS/Javascript и других технологий, на которых основан Web.
>Берем еще библиотеки, собираем просмотровщик. Все - есть опенсорсный, однозначно выглядящий, без задних ходов, ни от кого не зависящий формат только для документов. При желании добавить в архив xml с описанием форм, а в плеер - возможность их заполнения, тоже не проблема. И электронную подпись. И прочую, уже существующую в открытых проектах, функциональность. Нет?
А потом еще Javascript, Java-апплеты, возможность соединения по сети и встроенный Flash. А потом сказать, какое получилось тормознутое и глючное поделие и предложить следующий "новый, открытый стандарт только для документо, ну, можно еще там формы сделать и ЭЦП...".
>Что мы имеем: PDF - громоздкое, дырявое, направляемое алчной Adobe явление - но с этим, по большому счету, никто ничего сделать не может.
PDF - открытый стандартизированный формат. Специальными расширениями от Adobe пользоваться никто не заставляет.
>Ставят заплатки на дыры - и все...
А в ядре Линукс тоже иногда обнаруживают уязвимости. Думаю, надо ядро выкинуть, а то с ним ничего поделать не могут: ставят заплатки, и все...
Пока что все обнаруживаемые проблемы формата PDF являются общими для любых форматов, которые могут содержать исполняемый код со сколь-нибудь нетривиальными функциями. Их надо решать, спрашивая у пользователя, включить такую функциональность или не включать, и, если включит, запускать "в песочнице". Дыры в просмотрщиках нужно заделывать по мере обнаружения. Вот и все. Так сейчас и происходит.
> ни одного сообщения об альтернативах для HMTL/CSS/Javascript и других технологийЕсли бы направление развития этих технологий задавалось не W3C, а, например, МС - вы бы тоже считали, что альтернативы не нужны? Я считаю главным недостатком PDF именно то, что им, теоретически свободным, на практике распоряжается Adobe.
> А потом еще Javascript, Java-апплеты, возможность соединения по сети и встроенный Flash.
У меня на компьютере сейчас можно найти не один десяток PDF-ок. Ни в одной из них нет и не нужно ничего из вышеперечисленного. Я имею основания полагать, что в документообороте эти возможности тоже совершенно не востребованы. Кстати, если бы PDF/A и PDF/X были разными форматами и открывались разными программами, проблем было бы заметно меньше, вы не находите? Но их разъединение не выгодно... угадайте, кому?
> Пока что все обнаруживаемые проблемы формата PDF являются общими для любых форматов, которые могут содержать исполняемый код со сколь-нибудь нетривиальными функциями.
Я и говорю об альтернативном формате, не включающем исполняемого кода, но при этом вполне пригодном для большинства ниш, где сейчас используется PDF. Большей частью весь интерактив, который требуется от PDF - это гиперссылки и заполнение полей.
>Я и говорю об альтернативном формате, не включающем исполняемого кода, но при этом вполне пригодном для большинства ниш, где сейчас используется PDF.Так ведь сами же говорите: исполнимый код в PDF почти нигде и не используется. Так зачем же новые форматы?
Ни один нормальный просмотрщик PDF не должен исполнять в нем никакого кода, не спросив пользователя. Если он, конечно, вообще способен его исполнять. В документообороте никто не будет таких фич использовать, так же, как не используют без предварительной договоренности .doc/.odt с макросами, например. Или вы считаете, что формат OpenDocument тоже следует разделить на два: один без макросов, другой с ними?
>Но их разъединение не выгодно... угадайте, кому?
Никому. PDF сейчас используется в сотнях приложений, а также в читалках и других устройствах, где он в прошивке. Разделение его на два формата растянется лет на 5-10, как минимум, и вызовет хаос. Причем за эти 5-10 лет придумают более эффективный формат, который не получит достойной рекламы просто из-за того, что рекламировать будут то, на что распадется PDF.
К сожалению, реальность такова, что в основном используется просмотровщик от Adobe, способный исполнять все эти ненужные вещи. А открывая pdf-файл, на глаз не скажешь, содержит он "излишки" или нет. И наши с вами рассуждения о том, что должен или не должен делать просмотровщик, никак не влияют на то, как решит сделать Adobe в своем Reader'е.Кстати, разделение форматов вы почему-то связываете с тем, что базовый формат будет каким-то другим. Вам не кажется более логичным оставить в покое "старый добрый PDF" и назвать иначе новый, продвинутый формат, который все равно не знают никакие прошивки и старые приложения? И в него пихать эти потенциально опасные плюшки? Adobe, однако, этого не сделала...
>>Самое неприятное в этих кипах новостей про недостатки PDF - ни одной новости об альтернативном формате. Сколь угодно непопулярном, недоделанном, не одобренном комитетами - но хотя бы концептуально существующем. Ни одной...
> А еще тут иногда появляются сообщения об уязвимостях в известных браузерах. И
> ни одного, ни одного сообщения об альтернативах для HMTL/CSS/Javascript и других
> технологий, на которых основан Web.И, между прочим, это тоже очень печально.
> При том, что PostScript открыт, и алгоритмы сжатия не все запатентованыПостскрипт - имперавтивный язык, и принажлежит тому же Эдобу. Тогда уж нужно было пердложить яву использовать, мол безопаснее.
> Постскрипт - имперавтивный язык, и принажлежит тому же ЭдобуНасколько я понимаю в законах, язык не может никому принадлежать. Могут быть только патентные ограничения на определенные алгоритмы реализации. Но, судя по существованию Ghostscript, в данном случае эти ограничения вполне преодолимы. Да что там - уже преодолены!
> Тогда уж нужно было пердложить яву использовать, мол безопаснее.
Какое отношение языки программирования общего назначения имеют к описанию графической структуры документа? Или, перефразируя вопрос: почем в Киеве бузина?
> Какое отношение языки программирования общего назначения имеют к описанию графической структуры документа?Это и есть тот вопрос, который я хотел задать применительно к постскрипту в качестве альтернативы pdf. Там конечно есть несколько рудиментарных декларативных элементов для описания структуры документа, но в общем-то это такой-же императивный язык поверх специализированной VM, технически всё то-же самое могло бы и на яве например работать, или на яваскрипте. Не поймите не правильно, я не в пользу явы, я против того чтобы постскрипт вообще называть форматом.
PostScript - не язык общего назначения, и на нем есть готовые решения для базовой графики, внедрения шрифтов и изображений, трансформаций... продолжать? PostScript - это формат с возможностью программирования, но все-таки в первую очередь это именно формат.Дело, видимо, в том, что императивно описывать изображение удобнее и короче, чем структурировать его в xml, например. Но если вам ближе xml - пожалуйста, замените в моем посте PS на SVG, от этого мало что изменится...
И этотформат теперь в CUPS по-умолчанию. Я же говорил поспешное решение
Да, не послушали они тебя :(
Это Apple взяла под контроль CUPS и проталкивает туда свои идеи.
Формат может быть и ужасен.
Но почему-то все - и IEEE Xplore и rls.ru (с помощью DefView, например) представляют свои электронные материалы именно в PDF. Где альтернатива? Может DJVu, ePUB?
XPS (;,;)
Я не думаю что формат ужасен. http://www.linux.org.ru/forum/talks/5745635?lastmod=12939972...В своё время PS тоже был предложен Adobe. И в нём тоже были ошибки.
> Формат может быть и ужасен.
> Но почему-то все - и IEEE Xplore и rls.ru (с помощью DefView,
> например) представляют свои электронные материалы именно в PDF. Где альтернатива? Может
> DJVu, ePUB?не поверите: txt
эээ, чтобы всё это сделать клиентский ридер должен это поддерживать, а если он это поддерживает, эти ф-и должны быть отключаемы, в чём проблема-то?
1. Не обо всех фичах известно (про флэш например не знал, ибо "а на хрена оно там?")
2. Не все фичи могут иметь галочки в настройках конкретного вьювера.
3. И вообще, пришел к выводу, что чем меньше браузер умеет, тем он безопаснее :) и пофиг, что некоторые сайты криво отображаются...
> PDF документ может ... сканировать локальную сетьwhen u see it
u shit brix
> Таким образом можно запутать антивирусЧёто всё про венду да про венду. Если их антивирус запутается то есть повод срубить бабла и всё почистить если они сами безрукие :)