<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Релиз открытого ETL пакета Pentaho Data Integration 3.2.0</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html</link>
    <description>Вышел (http://forums.pentaho.org/showthread.php?t=69927) релиз Pentaho Data Integration 3.2.0 (http://sourceforge.net/project/showfiles.php?group_id=140317) (PDI, также называемая Kettle) - компонент комплекса Pentaho отвечающий за процесс Извлечения, Преобразования и Загрузки (Extract, Transform and Load - ETL). Данная система чаще всего используется при работе с хранилищами данных, но так же её возможности позволяют осуществлять:&lt;br&gt;&lt;br&gt;&lt;br&gt;-  Обмен данными между приложениями или базами данных&lt;br&gt;-  Экспорт информации из баз данных в файлы различных типов&lt;br&gt;-  Загрузка массивов данных в базы данных&lt;br&gt;-  Обработка данных&lt;br&gt;-  Интеграция с другими приложениями&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;Новое (http://sourceforge.net/project/shownotes.php?release_id=682677) в данной версии:&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;-  Улучшена визуальная составляющая: реализована цветовое деление с мини-иконками для различных типов переходов, также стала более интуитивной система подсказок.&lt;br&gt;-  Добавлены новые виды этапов обработки и заданий.&lt;br&gt;-  Импортирован этап обраб...&lt;br&gt;&lt;br&gt;URL: http://forums.</description>

<item>
    <title>Плюсы релиза стабильность и простота освоения (Andrej Svininykh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#10</link>
    <pubDate>Tue, 19 May 2009 03:26:02 GMT</pubDate>
    <description>&amp;gt;Конечному пользователю все равно учить термины. Т.ч. на русском нужна документация: описание &lt;br&gt;&amp;gt;принципов работы, пояснения создания схем, примеры и т.п. Перевод интерфейса IMHO &lt;br&gt;&amp;gt;бесполезен. &lt;br&gt;&lt;br&gt;Да, документация для PDI: Kettle очень неплоха, одно описание каждого из шагов в модуле Spoon чего стоит (http://wiki.pentaho.com/display/EAI/Pentaho+Data+Integration+v3.2.+Steps). Здесь не только о всём рассказано, но и всё на примерах показано, конечно перевести её задача на порядок большая, чем перевод интерфейса. Но на русском языке документ описывающий работу PDI: Kettle я пока знаю только один (http://www.javaportal.ru/articles/Pentaho_Data_Integration.html).&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Плюсы релиза стабильность и простота освоения (upyx)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#9</link>
    <pubDate>Tue, 19 May 2009 00:55:00 GMT</pubDate>
    <description>&lt;br&gt;&amp;gt;Вопрос в другом нужен-ли для такой системы перевод на русский язык. Плюс &lt;br&gt;&amp;gt;конечно будет в популяризации данного пакета, но проблема в сложности перевода. &lt;br&gt;&lt;br&gt;Ну дык &quot;на данный момент нет сложившейся русской терминологии в области ETL. Для начала работы по локализации PDI требуется создание определённого круга единомышленников, который и будет создавать (согласовывать) эту терминологию&quot;&lt;br&gt;&lt;br&gt;Конечному пользователю все равно учить термины. Т.ч. на русском нужна документация: описание принципов работы, пояснения создания схем, примеры и т.п. Перевод интерфейса IMHO бесполезен.&lt;br&gt;</description>
</item>

<item>
    <title>Релиз открытого ETL пакета Pentaho Data Integration 3.2.0 (Andrej Svininykh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#8</link>
    <pubDate>Mon, 18 May 2009 18:09:12 GMT</pubDate>
    <description>Кстати интересна возможность использования ETL систем в рамках стандарта Electronic Data Interchange (EDI). А конкретно PDI:Kettle интересно приспособить для обработки/организации электронного документооборота по средствам электронных документов EDIFACT или XML/EDIFACT.&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Плюсы релиза стабильность и простота освоения (Andrej Svininykh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#7</link>
    <pubDate>Mon, 18 May 2009 17:54:06 GMT</pubDate>
    <description>Сам работаю с данной системой примерно три месяца, для меня PDI: Kettle это первая и пока единственная ETL с которой я знаком. Использую пока наверное 5&#037; от её потенциал, кроме задач связанных с синхронизацией для Openbravo POS (источники Openbravo ERP, файлы Excel, файлы выгрузок 1С и Штрих-М), делал схемы для обработки данных из логов АТС (собственный формат log), объединения информации отчётов по гарантийным ремонтам сервисного центра (самые различные виды CVS и Excel). Сначала работал с версией 3.1.0 много было нареканий к стабильности работы (что отмечали многие), начиная с выходом 3.2.0 RC1 нареканий к стабильности работы пока нет. &lt;br&gt;&lt;br&gt;Визуальная составляющая также стала лучше. Вообще мне в PDI: Kettle она больше всего и понравилась, процессный подход больше позволяет концентрироваться на анализе данных, чем на самом механизме работы с ними. Мне конечно сложно судить насколько дружественна среда в случае если с ней будет работать человек с программированием незнакомый (хотя знаний нужны на уровне профес</description>
</item>

<item>
    <title>Релиз открытого ETL пакета Pentaho Data Integration 3.2.0 (Mr.Close)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#6</link>
    <pubDate>Mon, 18 May 2009 12:49:30 GMT</pubDate>
    <description>Коллега, если Вы не в курсе &quot;нафига эта штука вообще нужна&quot;, то Вам она скорее всего и не нужна.  ))) А тем, кто постоянно работает с обменом данными в &quot;промышленных масштабах&quot; объяснять не нужно. В качестве примера - обычный банк, работающий с физлицами... Фактически любая перегрузка данных из одной БД в другую - это ETL-процесс, хотя специальных средств в нем и не используется. )))&lt;br&gt;&lt;br&gt;Не стоит сравнивать ETL и ESB. Это сильно разные механизмы по устройству и назначению и часто дополняют друг друга. Выбор механизма в каждом конкретном случае сильно зависит от бизнес-задачи и имеющихся ресурсов. Оперативность ESB сильно перекрывается ее ресурсоемкостью. Если все обмены данных проводить по ESB, то вполне реально ее убить вконец. ETL гораздо экономнее к ресурсам, если считать относительно объемов передаваемых данных. Обычно оперативные (транзакционные) обмены между OLTP-системами сочетают с ETL-обменами для отчетно-аналитических систем. А баланс между этими двумя технологиями - задача для хорошего архитектора. </description>
</item>

<item>
    <title>Релиз открытого ETL пакета Pentaho Data Integration 3.2.0 (Andrej Svininykh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#5</link>
    <pubDate>Mon, 18 May 2009 11:28:08 GMT</pubDate>
    <description>Да ETL в некотором роде один из элементов построения ESB. В случае PDI: Kettle это один из элементов системы The Pentaho BI Project. Однако реализованные в программе возможности позволяют использовать её в построении и других систем где необходимо загрузка и преобразование данных.&lt;br&gt;</description>
</item>

<item>
    <title>Релиз открытого ETL пакета Pentaho Data Integration 3.2.0 (Andrej Svininykh)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#4</link>
    <pubDate>Mon, 18 May 2009 11:16:31 GMT</pubDate>
    <description>Например для выгрузки и обработки данных из множества различных (с разной структурой) Excel файлов, для дальнейшей загрузки в СУБД. &lt;br&gt;&lt;br&gt;PDI:Kettle рассчитана на работу по обмену данными между различными хранилищами информации. Основная область применения организация обмена между различными системами автоматизации в случаях когда переход к единой системе невозможен.&lt;br&gt;&lt;br&gt;Пример. Есть Поставщик у которого есть &quot;Система Учёта А&quot;, Покупателю он предоставляет накладные в электронном виде. У Покупателя есть &quot;Система Учёта Б&quot; в неё требуется загрузить информацию из накладных. PDI:Kettle необходим для того что-бы для каждого поставщика имеющего различные формы электронных накладных составить схемы обработки. PDI:Kettle можно настроить для работы по расписанию или запускать через скрипт, информация может быть доступна по e-mail, ftp, http и т.д.&lt;br&gt;</description>
</item>

<item>
    <title>Релиз открытого ETL пакета Pentaho Data Integration 3.2.0 (uZver)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#3</link>
    <pubDate>Mon, 18 May 2009 07:50:26 GMT</pubDate>
    <description>&amp;gt; И это описание мне очень напоминает функционал Enterprise Service Bus где тоже есть поддержка шаблона ETL.  &lt;br&gt;&lt;br&gt;че то байда. ESB это постоянно работающий процесс преобразующий данные на лету (on-line) и идет ESB прокидывает данные до их сохранения в БД.&lt;br&gt;А ETL это процесс выгрузки-загрузки работающий с большим объемом данных, часто в ночное время (off-line). Работает по данным уже сохраненным в БД.&lt;br&gt;&lt;br&gt;Они ортогональны по принципу работы, но взаимозаменяемы. ESB позволяет получить результат сразу в отличии от ETL.&lt;br&gt;</description>
</item>

<item>
    <title>Релиз открытого ETL пакета Pentaho Data Integration 3.2.0 (ditansu)</title>
    <link>https://www.opennet.dev/openforum/vsluhforumID3/54507.html#2</link>
    <pubDate>Mon, 18 May 2009 05:44:22 GMT</pubDate>
    <description>IMHO, например, для того чтобы использовать как ядро для процесса миграции данных из одинаковых по назначению систем (CRM, биллинг и т.п.) но имеющие разную семантику данных. Что требует по мимо простого извлечения/загрузки еще и преобразование. Например, в одной БД адрес включает и город и улицу в целевой БД есть отдельные поля для этих значений. Пишешь  правило /формулу для преобразования которое сплитит эти поля и все.  По традиции по ссылки не ходил, сужу по тому что написано здесь. И это описание мне очень напоминает функционал Enterprise Service Bus где тоже есть поддержка шаблона ETL.  &lt;br&gt;</description>
</item>

</channel>
</rss>
