Adversarial Patch Lab — Seberd Lab

Учебный симулятор адверсарных патчей и обмана классификаторов.

ЗАГРУЗКА ТЕКСТУР

ADV_PATCH_LAB · SEBERD IT BASE

ADVERSARIAL PATCH LAB

Симулятор: как маленький патч на изображении сбивает с толку классификатор.

Adversarial example — вход (пиксели), к которому добавлен небольшой, часто незаметный шум, так что модель меняет предсказание, хотя для человека объект тот же.

FGSM, PGD, C&W — методы поиска такого шума в цифровом пространстве. Здесь упрощённая «игровая» метрика вместо реального градиента по весам сети.

Physical patch — стикер или принт, который в реальном мире вводит камеру+модель в заблуждение (знаки, одежда). Digital patch — область пикселей на изображении.

В лаборатории ты рисуешь цифровой патч в редакторе и переносишь его на сцену — как в работах по adversarial patches на объектах.

Защита: adversarial training (добавление адверс-примеров в обучение), детекция OOD, сглаживание входа, ансамбли, сертифицированные границы (в идеале).

Ни один метод не даёт полной гарантии; оценка идёт под конкретную угрозную модель и бюджет атакующего.

Нажми Начать эксперимент.
Прочитай задание в появившемся окне — там написано, что нарисовал ИИ и что должно получиться после атаки.
Рисуй кистью прямо на объекте слева или на миниатюре патча справа. Используй разные цвета и размер кисти.
Нажми «Применить патч» — шкала уверенности модели обновится. Цель: опустить её ниже 40%.
При успехе откроется следующий уровень. Всего 14 уровней в случайном порядке — каждый запуск уникален.
«Очистить» — удаляет текущий патч. Теория в правой панели объясняет каждый уровень.

Чем больше площадь покрытия и контраст цветов — тем быстрее падает уверенность модели.

Adversarial Patch Lab — Seberd Lab

ADVERSARIAL PATCH LAB

Объект наблюдения

Редактор патча

Теория

ADVERSARIAL PATCH LAB

Объект наблюдения

Редактор патча

Теория

Материалы по теме