Adversarial Patch Lab — Seberd Lab
Учебный симулятор адверсарных патчей и обмана классификаторов.
Учебный симулятор адверсарных патчей и обмана классификаторов.
ADVERSARIAL PATCH LAB
Симулятор: как маленький патч на изображении сбивает с толку классификатор.
Adversarial example — вход (пиксели), к которому добавлен небольшой, часто незаметный шум, так что модель меняет предсказание, хотя для человека объект тот же.
FGSM, PGD, C&W — методы поиска такого шума в цифровом пространстве. Здесь упрощённая «игровая» метрика вместо реального градиента по весам сети.
Physical patch — стикер или принт, который в реальном мире вводит камеру+модель в заблуждение (знаки, одежда). Digital patch — область пикселей на изображении.
В лаборатории ты рисуешь цифровой патч в редакторе и переносишь его на сцену — как в работах по adversarial patches на объектах.
Защита: adversarial training (добавление адверс-примеров в обучение), детекция OOD, сглаживание входа, ансамбли, сертифицированные границы (в идеале).
Ни один метод не даёт полной гарантии; оценка идёт под конкретную угрозную модель и бюджет атакующего.
- Нажми Начать эксперимент.
- Прочитай задание в появившемся окне — там написано, что нарисовал ИИ и что должно получиться после атаки.
- Рисуй кистью прямо на объекте слева или на миниатюре патча справа. Используй разные цвета и размер кисти.
- Нажми «Применить патч» — шкала уверенности модели обновится. Цель: опустить её ниже 40%.
- При успехе откроется следующий уровень. Всего 14 уровней в случайном порядке — каждый запуск уникален.
- «Очистить» — удаляет текущий патч. Теория в правой панели объясняет каждый уровень.
Чем больше площадь покрытия и контраст цветов — тем быстрее падает уверенность модели.
Уровень
Описание
Объект наблюдения
Ожидание ввода...
Редактор патча
Шум на патче сбивает «уверенность» модели
Теория
Загрузка...