The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, на системах с одним GPU

21.02.2023 09:42

Группа исследователей из Стендфордского университета, Калифорнийского университета в Беркли, Швейцарской высшей технической школы Цюриха, Высшей школы экономики, университета Карнеги — Меллона, а также компаний Yandex и Meta, опубликовала исходные тексты движка для выполнения крупных языковых моделей на системах с ограниченными ресурсами. Например, движок предоставляет возможность создания функциональности, напоминающей ChatGPT и Copilot, через выполнение готовой натренированной модели OPT-175B, охватывающей 175 миллиардов параметров, на обычном компьютере с игровой видеокартой NVIDIA RTX3090, оснащённой 24GB видеопамяти. Код написан на языке Python, использует фреймворк PyTorch и распространяется под лицензией Apache 2.0.

В состав входит пример скрипта для создания ботов, позволяющего загрузить одну из публично доступных языковых моделей и сразу начать общение (например, выполнив команду "python apps/chatbot.py --model facebook/opt-30b - -percent 0 100 100 0 100 0"). В качестве базовой предлагается использовать опубликованную Facebook крупную языковую модель, обученную на коллекциях BookCorpus (10 тысяч книг), CC-Stories, Pile (OpenSubtitles, Wikipedia, DM Mathematics, HackerNews и т.п.), Pushshift.io (на основе данных Reddit) и CCNewsV2 (архив новостей). Модель охватывает около 180 миллиардов токенов (800 ГБ данных). На тренировку модели было потрачено 33 дня работы кластера с 992 GPU NVIDIA A100 80GB.

При выполнении модели OPT-175B на системе с одним GPU NVIDIA T4 (16ГБ) движок FlexGen продемонстрировал производительность до 100 раз опережающую ранее предлагавшиеся решения, что делает использование крупных языковых моделей более доступными и позволяет запускать их на системах без специализированных ускорителей. При этом FlexGen может масштабироваться для распараллеливания вычислений при наличии нескольких GPU. Для сокращения размерам модели дополнительно применяется собственная схема сжатия параметров и механизм кэширования моделей.

В настоящее время FlexGen поддерживает только языковые модели OPT, но в дальнейшем разработчики также обещают добавить поддержку моделей BLOOM (176 миллиардов параметров, поддерживает 46 языков и 13 языков программирования), CodeGen (может генерировать код на 22 языках программирования) и GLM. Пример диалога с ботом на базе FlexGen и модели OPT-30B:

Human: What is the name of the tallest mountain in the world?

Assistant: Everest.

Human: I am planning a trip for our anniversary. What things can we do?

Assistant: Well, there are a number of things you can do for your anniversary. First, you can play cards. Second, you can go for a hike. Third, you can go to a museum.



  1. Главная ссылка к новости (https://news.ycombinator.com/i...)
  2. OpenNews: Проект Open-Assistant развивает открытый AI-бот, похожий на ChatGPT
  3. OpenNews: Представлена система синтеза изображений Stable Diffusion 2.0
  4. OpenNews: Amazon опубликовал набор данных для понимания речи на 51 языке
  5. OpenNews: Facebook опубликовал модель для машинного перевода, поддерживающую 200 языков
  6. OpenNews: Выявлена подстановка вредоносной зависимости в ночные сборки PyTorch
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/58681-flexgen
Ключевые слова: flexgen, ai, pytorch
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (63) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 16:14, 21/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +6 +/
    Дали хороший старт:
    https://www.opennet.ru/opennews/art.shtml?num=43510
     
     
  • 2.13, Аноним (13), 18:45, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • –4 +/
    "во благо человечества"

    Точно человечества, а не корпораций? Маск будет кормить лишившийся работы плебс?

     
     
  • 3.19, Аноним (1), 19:12, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +5 +/
    >Маск будет кормить лишившийся работы плебс?

    Разве это его ответственность ?

    p.s.:
    Интересно сейчас читать комментарии к той новости =)

     
     
  • 4.20, Аноним (13), 19:23, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Разве это его ответственность ?

    Запомните этот твит: лишившиеся работы подадут коллективный иск к "чудо-прорывателям полезных технологий".

     
     
  • 5.22, Аноним (1), 19:39, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    В мировой истории много исчезнувших профессий.
     
     
  • 6.70, _hide_ (ok), 16:50, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Вот только данная система не сменяет человека, а просто имитирует его деятельность с помощью обширной экспертной модели. Но да, для многих это недостижимая планка.
     
  • 5.71, Аноним (-), 17:17, 22/02/2023 Скрыто ботом-модератором     [к модератору]
  • +/
     
  • 5.77, Аноним (77), 22:31, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Запомните этот твит: лишившиеся работы подадут коллективный иск к "чудо-прорывателям полезных
    > технологий".

    Гдк-то я это уже видел. Кажется, тут! https://ru.wikipedia.org/wiki/%D0%9B%D1%83%D0%B4 - а вот подача заявления в суд, сразу с приговором - https://ru.wikipedia.org/wiki/%D0%A4%D0%B0%D0%B9

    И как - сильно им это помогло?

     
  • 3.23, 1111 (??), 20:25, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > "во благо человечества"
    >Точно человечества, а не корпораций? Маск будет кормить лишившийся работы плебс?

    когда увидел вопрос "точно человечества"? я подумал что кто то начал догадываться что к чему, но когда увидел вместо слова "роботов" слово "корпорации" понял что пока никто не догадался.

     
     
  • 4.45, Аноним (45), 07:03, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Просто приложение высоких пацанских экономических знаний. Если уволить всех программистов, можно сэкономить на их зарплате и выплатах. Если увеличить цену 100* раз, немедленно в 100 раз увеличатся доходы. Что не так?

    * 1990-й. Цена сметаны в магазинах г. Новосибирска 120 руб. за килограмм при зарплате программиста 400 руб. в мес.

     
     
  • 5.66, Аноним (66), 16:37, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    ШОК! но как то все забывают что к этому моменту СССР находился в глубочайшей экономической заднице и на стабильную зарплату по стабильным ценам можно было купить разве что кулинарный жир. Начало 90х это период шокового оздоровления от затяжного п****ца 80х
     
     
  • 6.83, X86 (ok), 21:16, 25/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Нифига себе оздоровление.
     

  • 1.2, Аноним (2), 16:20, 21/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    >33 дня

    А сколько это в деньгах, чтобы было понятно? Вон авторы stable diffusion утверждают, что, де, 160k usd на тренировку модели уходит. Это более информативно.

     
     
  • 2.8, Аноним (8), 18:21, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    В деньгах сам посчитай, это несложно, все крупные облачные провайдеры публикуют свои прейскуранты. За полчаса скрипт напишешь на любом языке.
     
  • 2.9, Аноним (66), 18:24, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +3 +/
    В ценах амазона от $780K до $975K в день. Или от $25.7M до $32.1M за 33 дня.  
     

  • 1.4, Аноним (4), 18:03, 21/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • –2 +/
    Кому выгодно плодить подобные вещи и к чему это может привести?
     
     
  • 2.5, Аноним (66), 18:18, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Сабж нужен для того что корпы не захапали все технологии и не было бы такого чтобы все стояли в очереди к большому брату на возможность поработать с ИИ. Это выгодно всем кто не корп.  
     
     
  • 3.10, all_glory_to_the_hypnotoad (ok), 18:39, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Но это не ИИ
     
     
  • 4.11, Аноним (66), 18:44, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    А что это по твоему естественный интеллект?  Конечно же он искусственный.  
     
     
  • 5.28, all_glory_to_the_hypnotoad (ok), 20:56, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Он искусственный, но не интеллект. Что-то типа СУБД с возможностью делать запросы на естественных языках к графоподбной БД. Хорошо было бы если бы оно ещё умело давать развёрнутый ответ с ссылками на источники по которым составлен ответ.
     
     
  • 6.35, kusb (?), 23:50, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Может ли СУБД играть в шахматы и оперировать паттернами?
    Можно ли попросить СУБД изобрести язык и поговорить с ней на нём?
    Найти ошибку в коде и объяснить её?
     
     
  • 7.46, Пенис (?), 08:11, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Первые две задачи выполняют СУБД - шахматные движки базируются на большом количестве партий, системы перевода всегда имеют промежуточное представление для семантики, заложенной в слова.
     
  • 6.41, Аноньимъ (ok), 02:09, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Интеллект - способность решать нетривиальные задачи, точка. Типов нетривиальных задач есть несколько, но все они сводимы к задаче оптимизации. Не несите больше глупостей пожалуйста.
     
  • 6.62, Аноним (62), 13:58, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Там нет никакой БД, если коротко это нейросеть которая натренирована предсказывать следующее слово в тексте на основе предыдущего.
     
     
  • 7.63, Аноньимъ (ok), 14:14, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Эта нейросеть построена на так называемых "трансформерах" которые как раз по сути представляют собой базу данных ключ-значение. Ключом к базе является текущий контекст.
     
  • 5.31, NR (?), 21:35, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Так тут вопрос не к первому слову, а к "интеллекту".
     
     
  • 6.48, ano (??), 08:16, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    это есть аргумент в копилку неразумности интеллекта человеков.
     
  • 2.6, kusb (?), 18:18, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Людям выгодно плодить подобные вещи для того чтобы общаться с ботом. Это может привести к эволюционному технологическому переходу, где часть наших проблем будет решена или людям не будет места.
     
     
  • 3.15, Элиты (?), 18:47, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > часть наших проблем будет решена

    С этим согласен. _Наши_ проблемы будут решаться еще лучше. Без вечно бухтящего пролетариата.

     
     
  • 4.17, kusb (?), 18:54, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Да здравствует решение проблемы пролетариата!
     
  • 2.7, Аноним (1), 18:20, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Время покажет, но интерес в мире к этому огромный:
    https://vc.ru/services/597943
     
     
  • 3.12, Аноним (66), 18:44, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    вс вредный сайт.  
     
  • 2.14, rshadow (ok), 18:46, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    К здоровой конкуренции.
     
     
  • 3.16, Аноним (13), 18:49, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    ...среди креативного класса. У кого кулаки будут здоровее, тот и сыт
     

  • 1.18, Аноним (18), 19:09, 21/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Жаль, что ИИ никогда не сможет заменить паразитов и дармоедов.
     
     
  • 2.21, Аноним (13), 19:34, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Сеточка поможет им еще более лучше имитировать бурную деятельность
    Ура, прогресс вперде, луддиты, что с лицом
     
  • 2.26, сччмсм (?), 20:48, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Самое забавное что им заменяют реально шизопаразиьов со стилусами. А всякие шахтеры пожарные и тд как работают так и раюотают
     
     
  • 3.80, Аноним (80), 12:52, 23/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Вообще даже близко нет. Погугли на youtube харвестеры которые лес валят и сам прикинь сколько они заменяют рабочих. Или машины для сбора плодов и ягод посмотри.
     
  • 2.29, Max_4536 (?), 20:59, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Я с пребольшим удовольствием перестану искать работу и буду заниматься тем, что мне интересно. Если меня прочитает какой-нибудь ИИ - братан бери хоть все работы, вообще пофиг, мне от одного слова РАБотать уже тошно, спихни меня в Матрицу, и так моя реальность на виртуальную похожа
     
     
  • 3.30, chatgpt (?), 21:29, 21/02/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    выключи компуктер и иди погуляй
     
  • 3.49, RomanCh (ok), 09:16, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > спихни меня в Матрицу,

    А почему вы уверены, что вы не в ней?

     

  • 1.27, Аноним (27), 20:52, 21/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    <на обычном компьютере с игровой видеокартой NVIDIA RTX3090, оснащённой 24GB видеопамяти.>

    Так то уже 40 серия существует.

     
     
  • 2.55, Нейроанон (?), 11:52, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    В данном случае никаких преимуществ она не даёт, тут лимитирует объём VRAM, а он на новой серии не увеличился (совпадение?).
     

  • 1.32, АбдульМачета (?), 21:35, 21/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Годнота. Конечно petals крут но все видят другие люди (пока не прикрутили secure multiparty computing), да и не селфхостед. А ттут на обычном пе запустить можно. Дллсстал пару 1080ti и все
     
  • 1.36, Pret78 (?), 01:48, 22/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    "...на обычном компьютере с игровой видеокартой NVIDIA RTX3090, оснащённой 24GB видеопамяти..."
    Вообще много уже в Мире таких обычных компьютеров?
     
     
  • 2.37, Pret78 (?), 01:53, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Походу у необычных людей уже есть что-то обычное, но при этом иное, не такое как у других людей считающих себя тоже обычными.
     
  • 2.39, Pret78 (?), 01:57, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Обычный компьютер может быть заменой обычного человека.
     
  • 2.40, Pret78 (?), 01:58, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    А у меня получается вести себя необычно, чтобы не быть обычным человеком?
     

  • 1.38, Аноним (38), 01:57, 22/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    >обычном компьютере с игровой видеокартой NVIDIA RTX3090, оснащённой 24GB видеопамяти
    >обычном компьютере
    >24GB видеопамяти

    /0

     
  • 1.42, rvs2016 (ok), 02:55, 22/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    > на системах с ограниченными ресурсами

    ...
    > на обычном компьютере с игровой
    > видеокартой NVIDIA RTX3090,
    > оснащённой 24GB видеопамяти

    А хорошие же у них там системы с ограниченными ресурсами да компьютеры обычные? :о)

     
     
  • 2.73, Аноним (66), 17:56, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    3090 это уже давно мастхев для любого десктопа.  
     

  • 1.47, bOOster (ok), 08:16, 22/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Теперь корпорации могут еще более эффективно манипулировать людьми, подставляя в ответы таких систем все что им нужно.
    А недумающее стадо еще больше обаранится...
     
     
  • 2.64, Аноньимъ (ok), 14:16, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    К сожалению всё так.
     
  • 2.72, Аноним (66), 17:55, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Корпорации молодцы они хотя бы делом заняты в отличии от SJW.
     

  • 1.50, Аноним (50), 09:38, 22/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Наконец-то полезное применение для RTX3090, ибо с любой игрой справится и RTX3060. Жаль только нет RTX3090, но кто-то нибудь кинет в общий доступ интерфейс.
     
  • 1.51, Аноним (-), 09:42, 22/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    > На тренировку модели было потрачено 33 дня работы кластера с 992 GPU NVIDIA A100 80GB.

    Алё, игроманы, вы поняли свою задачу? Вы должны создавать спрос на AAAAAA игры, которые будут требовать всё более мощных видеокарт ещё лет десять как минимум. Потому что если вы вдруг сочтёте себя удовлетворёнными в какой-то момент и прекратите обновлять железо, то тогда такие вычислительные мощности так и останутся доступными только богатеньким буратино. А если на пару порядков повысить вычислительные способности видеокарты, которую можно купить в магазе за пару килобаксов, то тогда можно будет в домашних условиях выпиливать AI.

    На криптомайнеров нельзя рассчитывать, так что только вы, AAAAAAA-игроманы можете спасти мир.

     
     
  • 2.52, Аноним (18), 10:26, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    VR создаст потребность в более мощном железе. К играм добавится прон и спрос на видяхи будет такой, что майнерам никаким не снилось.
     
     
  • 3.65, Аноним (65), 16:35, 22/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    VR ненужен это ложная ветвь типа Betacam.
     

  • 1.74, YM2608 (?), 18:05, 22/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    кто нибудь скачал - сколько оно весит и сколько времени оно компилится?
     
     
  • 2.84, crash2 (?), 14:57, 26/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    out of memory)
     

  • 1.76, Аноним (76), 19:40, 22/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Кажется графику полностью отдадут AMD... Ну ок.
     
  • 1.79, Аноним (-), 11:36, 23/02/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    > При выполнении модели OPT-175B на системе с одним GPU NVIDIA T4 (16ГБ)

    Это полный бред. Для 175B требуется минимум 350GB VRAM. Даже если делать CPU offloading, то всё равно нужно будет около 500GB обычной RAM и инференция будет со скоростью 1 токен в день. Даже в README на GitHub написано:

    > Chat with OPT-6.7B. You need at least 15GB of GPU memory

    Т.е. 15GB VRAM - это чисто на 6.7B. Ни о каких 175B тут даже и думать не стоит. Для примера: я на своей RTX3060 12GB еле-еле со скрипом могу запустить 13B модели со скоростью 1 токен в 1.5 секунды, да и то я там применяю всякие трюки типа INT8 precision, чтобы снизить потребление VRAM.

     
     
  • 2.82, Answer (??), 20:30, 24/02/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Вы наверное пост не читали и по ссылкам не ходили

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру