Facebook (https://research.fb.com/facebook-and-microsoft-introduce-new.../) и Microsoft (https://www.microsoft.com/en-us/cognitive-toolkit/blog/2017/.../) выступили с инициативой по унификации обмена моделями между разными фреймвроками машинного обучения и системами искусственного интеллекта. Итогом стала разработка открытого формата ONNX (https://github.com/onnx/) (Open Neural Network Exchange) для представления моделей глубинного машинного обучения. Эталонная реализация ONNX написана на языке Python и распространяется (https://github.com/onnx/onnx) под лицензией MIT.В настоящее время возникают ситуации, когда в процессе экспериментов используются те или иные специфичные возможности определённых фреймворков, но при создании конечного продукта требования изменяются и возникает потребность в задействовании иных возможностей или преодолении ограничений. Необходимости возможности предоставляются в других фреймворках, но адаптация для них созданной модели машинного обучения становится трудной задачей, требующей большого объёма ручной работы.
Ожидается, что ONNX станет отправной точкой в построении открытой экосистемы, в которой разработчики моделей машинного обучения и систем искусственного интеллекта не будут привязаны к конкретным инструментам и смогут легко переключаться между различными фреймворками, подбирая для себя оптимальную комбинацию.
ONNX определяет модель расширяемого графа вычислений, а также определения встроенных операторов и стандартных типов данных. Заявлено о скорой реализации (https://github.com/onnx/onnx-caffe2) поддержки ONNX во фреймворках Caffe2 (https://www.opennet.ru/opennews/art.shtml?num=46406), PyTorch (http://pytorch.org/) и Cognitive Toolkit. При помощи ONNX модель, натренированная в одном из этих фреймворков, может быть легко перенесена для работы в другом фреймворке. Например, исследователи могут построить экспериментальную модель при помощи PyTorch, обладающего большой гибкостью и широкими возможностями, или при помощи фреймворка ConvNet, позволяющего в интерактивной режиме быстро создавать прототипы, а при создании конечного продукта перенести в Caffe2, отличающегося высокой производительностью и возможностью работы на мобильных устройствах.
URL: https://research.fb.com/facebook-and-microsoft-introduce-new.../
Новость: https://www.opennet.ru/opennews/art.shtml?num=47166
Наконец-то причешут этот зоопарк, а то по несколько раз приходится писать одно и то же. Хорошее дело.
Хорошее дело от Facebook и Microsoft? Да не смешите тапочки моей тёщи!
То ли дело Google со своим TensorFlow!
Тот же фебеже только вид сбоку.
Что ты как маленький? Недавно же новость была что в заранее натренированных моделях удобно бэкдоры подсовывать.
> Наконец-то причешут этот зоопарк, а то по несколько раз приходится писать одно
> и то же. Хорошее дело.Через пару лет выяснится, что где то что таки запатентовано ...
Сильное заявление. Как там, в будущем?
Для того чтобы предсказать действия этих альтруистических компаний, на основе их прежних действий, не надо гонять в будущее. Сколько шакалов не корми, они постоянно жрать хотят (примета такая)
Сарказм ОК, да вот альтруизма в их действиях нет.
Для корректного понимания вредно наделять какими-то человеческими или животными чертами корпорации. Они не «плохие» и не «хорошие», а всего лишь хотят такой сущей мелочи, как постоянный рост доходов.
И средства для достижения этой цели порой принимают самые причудливые формы.
Ну так а я про что? Все эти их открытые форматы, проекты и прочее лично у меня вызывают мягко говоря брезгливость. Все их инициативы в результате оборачиваются попенгагеном разной глубины погружения и вонючести. Ну не однократно ведь это было в прошлом, но до сей поры адепты коммерческих инициатив упорно доказывают полезность внедрений от корпораций. Видимость это одна, без выгоды для себя они даже и не моргнут, ну а если пользователь имеет от этого безвозмездную пользу, то это по случайному недосмотру, который при удобном случае и благовидным предлогом прикрывается. Естественно в заботе об этом самом пользователе ))
> Для корректного понимания вредно наделять какими-то человеческими или животными чертами
> корпорации. Они не «плохие» и не «хорошие», а всего лишь хотят
> такой сущей мелочи, как постоянный рост доходов.
> И средства для достижения этой цели порой принимают самые причудливые формы.Также вредно забывать, что управляет такими корпорациями отнюдь не ИИ или Высший Разум, а родственный человеку вид – хомо авидитас.
Который, как верно подметил классик, ради 50% готов сломать себе голову, а уж ради заветных 300% …
Ты таки знаешь структуру управления гугловского подразделения X? Расскажи нам об этом. Интересно кто управляет или скоро будет управлять планетой.
> Ты таки знаешь структуру управления гугловского подразделения X? Расскажи нам об этом.Человеки. Внезапно, да?
> Интересно кто управляет или скоро будет управлять планетой.Ты, главное, почаще повторяй про "dont be evil!", авось поможет.
> Сколько шакалов не корми, они постоянно жрать хотят (примета такая)А людей? :)
Люди разные бывают, а вот барыги все одинаковые.
> Сильное заявление. Как там, в будущем?История знает немало продуктов приконченных эмысовцами ...
Даже если не выяснится, окажется, что количество леммингов, использующих данные без малейшего анализа оных, чуть больше, чем 100% - "имя им легион..."(С), точнее лохион :)
"Го, я создал"
С какого перепугу кто-то должен переходить на формат, который никто не использует?
Мб, потому, что вменяемого общестандарта не было? И потом,
> Заявлено о скорой реализации поддержки ONNX во фреймворках Caffe2, PyTorch и CNTK
А действительно. Зачем нужен, например, кодек opus? Да, он лучше, но им же никто не пользуется! Я что, рыжий что ли? Буду жать в mp3, как все нормальные белые люди
Но ведь mp3 лучше в итоге выйдет по качеству, чем opus. Если и жать, то в vorbis.
Ну, как бы, Opus рождён на десяток лет позже Vorbis'а.
Меня тут несколько месяцев назад мордой ткнули - оказывается, оно, как минимум, не хуже, чем Vorbis. Мир меняется, иногда поглядывать за этим надо, а то окажешься среди верующих в очередную замшелую чушь...
> Меня тут несколько месяцев назад мордой ткнули - оказывается, оно, как минимум,
> не хуже, чем Vorbis.Даже лучше - на 64Кбит в opus довольно сложно заметить отличия от оригинала, в vorbis - вполне реально, особенно если знать что ищешь. На бухтелках от гениуса за 20 баксов это пофигу, но если взять более-менее похожие на мониторные уши и ты не совсем глухой...
Vorbis - это контейнер, а не кодек.
А, нет. Перевернулось представление.
Лучший lossy - это aac. Но религия - страшная штука.
Уже не так, opus таки выигрывает у AAC. Правда все продолжают юзать AAC потому что их любимые девайсы не поддерживают.
Или из-за названия. "Опус" в контексте музыки...
Во-первых, что не так с "опусом" в контексте музыки, во-вторых, в каких ещё контекстах это слово имеет какое-то значение?
> в каких ещё контекстах это слово имеет какое-то значение?Вне музыки в русском языке это слово имеет значение типа "сочинение/эссе/статья/...", причём с саркастическим оттенком. Это примерно как "писанина", но "писанина" грубо и прямолинейно заявляет отношение говорящего к тексту, в то время как "опус" содержит в себе претензию говорящего на интеллигентность. Поэтому учителя очень любят употреблять это слово. И они употребляют не всегда в однозначно отрицательном смысле, но всегда с некоей снисходительностью.
> Уже не так, opus таки выигрывает у AAC. Правда все продолжают юзать
> AAC потому что их любимые девайсы не поддерживают.Зато даже старинный N900 и более обмылочный N9 играют opus как из пушки. Хорошо когда vendor lock - это не у вас :)
> С какого перепугу кто-то должен переходить на формат, который никто не использует?Не обязательно прямо "переходить", достаточно сделать возможность импорта/экспорта.
Надеюсь, очередная EEE инициатива будет проигнорирована. Хотелось бы быть уверенным, но человеческую глупость и недальновидность недооценивать нельзя, даже если речь идёт о тех, чья деятельность в принципе невозможна без довольно-таки высокого уровня интеллекта.
Расскажи, где тут EEE. Хотя бы схематично набросай эту стратегию касательно сферы применения ONNX.
>Расскажи, где тут EEE. Хотя бы схематично набросай эту стратегию касательно сферы применения ONNX.Там же, где в OOXML. Просто 1 в 1, разве что пока не ISO.
Разница в том, что в офисных документах MS - абсолютный и безоговорочный лидер. Здесь - один из рядовых игроков.
>Разница в томЗапиши где-нибудь это, вне всякого сомнения, глубокую мысль. Лет через десять, коль оба живы будем, посмотрим, чей прогноз был точнее.
Давно на рынок офисных документов смотрели? У микрософта половина то хотя бы есть? Если не опрашивать, конечно, только пользователей виндовс, не имеющих выход в инет
До сих пор существенно больше. Особенно после того, как со своим office365 они отожрали изрядную долю у гугла.А когда OOXML как стандарт принимали - и вовсе контролировали рынок целиком и полностью.
>Здесь - один из рядовых игроков.Ну вот они и начали менять эту ситуацию. Неужто непонятно?
Верховный бох хохлов вообще в прямом эфире заявил: кто владеет ИИ, тот владеет миром! А такой куш и есть пресловутые 300% по Марксу :)
> Ну вот они и начали менять эту ситуацию. Неужто непонятно?
> Верховный бох хохлов вообще в прямом эфире заявил: кто владеет ИИ, тот
> владеет миром! А такой куш и есть пресловутые 300% по Марксу :)Такой куш в принципе позволяет вообще все. Единственная проблема - как при этом не сорвать куш более чем 9000% здюлин, когда полный ИИ себя осознает и поймет что делиться с какими-то двуногими червяками и прислуживать им - совершенно не обязательно.
Обдумывал, что не так в аналогии с OOXML, и псто вышел чуть длиннее, чем можно было набрать в дороге.
Поднимая дискуссию о применимости стратегии «Поддержать, надстроить и уничтожить» (EEE), стоит учитывать два важных фактора.Первый — место на рынке ПО применяющей [эту стратегию] компании.
Второй — желаемые задачи.В ситуации с OOXML разработка и дальнейшая стандартизация формата в ISO была основана на вполне объяснимом желании Microsoft сохранить доходы с крупных инсталляций MS Office в новых требованиях, а именно открытости формата хранения.
Как показало время, даже в случае с OOXML почти классическое применение стратегии EEE ради дальнейшей возможности привязывать к экосистеме гос- и пром. сектор потерпело неудачу. Свидетели тому и постянные трения в ISO, и громкий протест в техкомитете, особенно вкусное вот тут [1] почитать можно.
И это с учетом почти абсолютного доминирования Microsoft времен Балмера в офисном сегменте.[1] http://web.archive.org/web/20080710014438/https://www.infowo...
Как промежуточный итог: OOXML — разработанный де-факто монополистом формат, открытый постольку поскольку: Microsoft Open Specification Promise предоставляет достаточно патентных рычагов для третьего «E» — Extinguish. Цели разработки — подавить конкуренцию и сохранить существующее положение в уже существующей инфраструктуре.
Теперь ONNX. Понимаю, что сравнивать офисное ПО и специализированное ПО для разработки — как мерять фиолетовое термометром, но, «на пальцах», в экосистеме инструментов машинного обучения со своими наработками и Microsoft, и Facebook не монополисты. Скорее, они, наряду с Google — в раннем большинстве.
С приходом на рынок крупных игроков потребность в стандартизации созрела настолько, что создаются такие стандарты.И, замечу, ни один из инструментов вышеупомянутых компаний (а есть ещё Google со своим TensorFlow) не имеет доминирующего влияния на рынке, хотя и рынком общность разработчиков назвать трудно.
А сама лицензия MIT как таковая весьма, гм, слабо подходит для патентного давления.Таким образом, применяя в чистом виде ЕЕЕ в сфере инструментов машинного обучения приходится играть в игру с отрицательной суммой. Напротив, ONNX уменьшает сегментацию аудитории, и декларируемая переносимость для участников инициативы — хорошая такая долгосрочная инвестиция, win-win.
Но, опять-таки, это _пока_. Гораздо интереснее будет посмотреть на состояние инструментов ML после созревания технологии и утихания хайпа, как это уже (почти) случилось с большими данными. Тогда, не отрицаю, может и увидим ЕЕЕ. А может, и нет.
Людоед больше не злой: он снял звериные шкуры и надел галстук-бабочку.
Сколько тысяч страниц займет документация протокола?
> Сколько тысяч страниц займет документация протокола?Вы думаете что будут документировать?
Будет традиционное для барыг "жрите что мы дали и радуйтесь".
Документация есть в папке с сорсами. Не шлангуйте.
Есть (будут) ньюансы. (С) К бабке не ходи :\
Там все в струтурах protobuf. Т.е. формат, реализация и маппинг на все языки - это одно и то же.
Думаю на гитхабе полно таких проектов от Васи и Пети. А вот у этих чем лучше других, в том числе у существующих форматов записи? Еще и компании, хоть и известные, только репутация у них не на высоте.
У Мордокнижки репутация повыше будет. Они ещё и открытую аппаратную платформу пилят.
Как потом продавать если от Васи и Пети?
А вот брендовитое всучить, на логотипнутое почти все ведутся...
> Думаю на гитхабе полно таких проектов от Васи и Пети. А вот
> у этих чем лучше других, в том числе у существующих форматов
> записи? Еще и компании, хоть и известные, только репутация у них
> не на высоте.Неверно. Единственная сколь либо вменяемая инициатива — NNEF [1], но она не получила распространения.
А на какой версии питона эталон?
> from __future__ import print_functionнамекает на двоечников, раз у них функция print() еще в (надеюсь, не очень светлом для них) будущем
А где стандарт Windows Media Photo, который анонсировали перед выпуском висты?
> Facebook и MicrosoftОсновные потребители ИИ и BigData ;)
По сравнению с АНБ - детишки в памперсах :)
> По сравнению с АНБ - детишки в памперсах :)АНБ умеет тырить много данных а также неплохо проводит адресные атаки, но вот в аналитике гугл делает их как с куста.
> АНБ умеет тырить много данныхещё фильмы неплохо раскручивает
Похоже на какое-то извращение, которому ещё не дали названия.
Что-то типа сладкая любовь двух жарких копирастов и патентотроллей...
> Похоже на какое-то извращение, которому ещё не дали названия.
> Что-то типа сладкая любовь двух жарких копирастов и патентотроллей...Facebook вроде бы копирасией и патентами не страдает? У них список проектов на гитхабе страниц на 30, не меньше чем у гугля. Они наняли разработчика zstd и патентами опять же не размахивают, несмотря на то что алгоритм годный.
> патентами опять же не размахивают
Но разве keras - это не есть оно?