The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Атака на AI-системы ArtPrompt, позволяющая обойти защиту при помощи ASCII-картинок, opennews (ok), 03-Мрт-24, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


14. "ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..."  +/
Сообщение от Аноним (14), 03-Мрт-24, 13:23 
К сожалению, предсказываю, что цензурасты перейдут к следующему очевидному методу, против которого, я предполагаю, не будет приёма.

1. Тренировка нецензурированной модели на всех данных.
2. Составление промпта для разделения исходного дейтасета на 2: первый будет испольдоваться as is, второй будет зацензурен.
3. Составление запросов для замены информации во втором дейтасете на дезинформацию. Возможно — с привлечением человеческих экспертов для конкретного продумывания, какая будет дезинформация. Напр. в текстах об определённом государственном деятеле возможно (я категорически против реализации такого, просто констатация факта, что такое возможно реализовать) заменять его критику на восхваления, присяги ему на верность, добавлять его список титулов. А тексты про определённые ценности возможно менять образом, чтобы в результирующем тексте эти ценности и их сторонники с одной стороны демонизировались, а с другой — выставлялись жалкими и дегуманизировались.
4. слияние немодифицированной часть дейтасета с модифицированной и перетренировка модели.

Реализация такого может привести к протеканию цензуры и дезинформации во вторичные более компактные опенсорсные модели, намеренно не реализующие цензуру, (напр. производные LLAMA), но обученные на качественных инференсах больших, дорогих и более умных моделей, но отцензурированных, моделей (вроде ChatGPT, Bard, Bing, etc).

Ответить | Правка | Наверх | Cообщить модератору

17. "ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..."  +/
Сообщение от cheburnator9000 (ok), 03-Мрт-24, 13:34 
Они сами себя отправляют дезинформацией. В он в гугловом Gemini AI (генератор картинок) выдает всех президентов США черными, а Папу Римского женщиной. Борец с "системным расизмом" сотрудник гугла уже признался что, делал это сознательно и, по-видимому, по указке начальства, твиттер аккаунт этого петуха @JackK
Ответить | Правка | Наверх | Cообщить модератору

19. "ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..."  +/
Сообщение от Аноним (19), 03-Мрт-24, 13:43 
Каким способом откинулся: по исчечению срока, по УДО, или другим способом? Обошлось без колостомы?
Ответить | Правка | Наверх | Cообщить модератору

58. "ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..."  +3 +/
Сообщение от Аноним (56), 03-Мрт-24, 22:19 
Я похожий подход уже видел в гугл-переводчике.

Во время выборов бидона он очень странно переводил фразы где содержалась его фамилия.

Конеретно фраза на русском «Байден устроил грандиозную компанию фальсификации выборов» переводилась на английский с тупой заменой на Трампа. Это у многих воспроизводилось.

Ответить | Правка | К родителю #14 | Наверх | Cообщить модератору

82. "ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..."  +/
Сообщение от пох. (?), 04-Мрт-24, 08:26 
чувак, не хочу тебя огорчать, оно так "переводит" со времен обамы если не буша.

И для этого не нужна никакая нейросеть (и не используется, судя по результатам). Обычный статистический анализатор.
Поэтому и палятся ольгинские на немаэ сечи терпеть цеи борошна. ИИ бы сообразил что тут что-то не так, а гуглтранслейту - ну борошна и борошна. Чем больше цитируют - тем уверенней он "переводит".


Ответить | Правка | Наверх | Cообщить модератору

97. "ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..."  +/
Сообщение от Аноним (95), 04-Мрт-24, 10:56 
Я только вчера проверял в Googlag Translate — вроде верно всё переводит.
Ответить | Правка | Наверх | Cообщить модератору

101. "ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..."  +/
Сообщение от Аноним (137), 04-Мрт-24, 14:15 
Потому, что перевод у них сейчас статистический, а не словарный. Ты всё проспал.
Ответить | Правка | К родителю #58 | Наверх | Cообщить модератору

104. "ArtPrompt - атака на AI-системы, позволяющая обойти фильтры ..."  +/
Сообщение от пох. (?), 04-Мрт-24, 15:55 
> Потому, что перевод у них сейчас статистический, а не словарный. Ты всё
> проспал.

в смысле "сейчас"? У гугля только такой и был, от рождения.

Но ИИ там и не пахнет.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру