Анализ выживаемости уязвимостей: от внедрения до исправления

Что показывает анализ жизненного цикла

Традиционно уязвимости воспринимаются как отдельные инциденты: появляется идентификатор, например, CVE-2024-12345, объявляется критичность, даётся рекомендация срочно её устранить. Периодические отчёты сообщают, сколько уязвимостей найдено в том или ином продукте за год. Однако подобные статические оценки не позволяют увидеть ключевой динамический процесс: сколько времени уязвимость реально присутствует в системе, и как этот срок зависит от свойств кода и организационных практик.

Метод Survival Analysis (анализ выживаемости) меняет взгляд: он фокусируется не на количестве, а на длительности. Основной вопрос — как долго “живет” уязвимость от момента внедрения до закрытия? Или, иначе: как скорость обнаружения и исправления зависит от класса уязвимости, типа компонента, команды и других факторов?

Практический результат такого подхода — количественные оценки, которые позволяют переосмыслить зрелость и расставить приоритеты работы с безопасностью. Например, выявляются неожиданные паттерны: половина критических уязвимостей обнаруживается в первые три месяца жизни компонента, но на их исправление в среднем уходит 9 месяцев. Или: уязвимости в устаревшем коде (legacy) остаются незамеченными в 4 раза дольше, чем в новых модулях. Такие сведения меняют стратегию управления безопасностью, делая процессы менее интуитивными и более адресными.

Почему жизненный цикл уязвимостей не совпадает с SDLC

Формальные методологии (например, SSDLC — безопасный жизненный цикл разработки) предлагают пошаговый вариант: требования, проектирование, кодирование, тестирование, эксплуатация. Но реальный жизненный цикл уязвимости — стохастическая последовательность событий, которые могут быть разбросаны во времени. Уязвимость может быть заложена на этапе проектирования и проявиться спустя годы, когда код попадёт в релиз.

Survival Analysis работает с неполными (“правоцензурированными”) данными: часто известна не дата появления проблемы, а лишь дата её обнаружения. Анализ позволяет оценить невидимую часть “айсберга” — те уязвимости, которые уже внедрены, но ещё не выявлены.

Например, среднее время “скрытого” существования уязвимости в Python-веб-сервисах может достигать 400 дней, а в Go — 180 дней. Это связано не только с языком, но и с экосистемой, распространённостью инструментов анализа и стилями командной работы.

Требования к данным для Survival Analysis

Для применения Survival Analysis недостаточно просто перечня CVE. Необходимы событийные данные для каждой уникальной уязвимости с учётом контекста инфраструктуры. Минимальные поля для анализа:

Идентификатор уязвимости — уникальный номер или CVE, может быть внутренним.
Дата внедрения (time_zero) — наиболее труднодостижимый параметр. Можно использовать дату коммита, в котором появился уязвимый код, дату выпуска версии или первую поставку продукта в продакшен. Часто определяется ретроспективно, с определённой погрешностью.
Дата обнаружения (event_time) — дата, когда уязвимость реально выявлена: автоматизированным сканером, ручным аудитом, внешним исследователем и пр.
Статус события (event) — бинарный флаг: “обнаружена” (1) или “ещё нет” (0). Это позволяет включать в анализ “живые” уязвимости, для которых срок очередной проверки ещё не наступил.
Ковариаты (covariates) — объясняющие признаки: тип уязвимости (SQLi, XSS, RCE и пр.), критичность (CVSS), компонент (бекенд, фронтенд, сторонняя библиотека), команда-владелец, язык программирования, наличие автотестов и покрытие анализом.

Сбор такой информации требует интеграции между системами: Git (история изменений), Jira/трекеры задач, CI/CD (даты сборок), сканеры безопасности, CMDB с атрибутами компонентов. Установить точную дату появления уязвимости зачастую приходится “по косвенным данным”, что вносит ошибки и влияет на доверие к итогам.

[ИЗОБРАЖЕНИЕ: Схема потока данных для Survival Analysis: источники данных (Git, CI/CD, тикет-системы, сканеры) стекаются в единое хранилище, где происходит сопоставление и формирование событийной таблицы с полями id, time_zero, event_time, event, covariate1, covariate2.]

Практический пример: анализ кодовой базы

Рассмотрим микросервисное приложение, для которого собран датасет: 150 уязвимостей, обнаруженных за два года эксплуатации. После построения модели (Kaplan-Meier estimator), которая отображает долю “выживших” (ещё не выявленных) уязвимостей во времени, виден характерный график.

[ИЗОБРАЖЕНИЕ: График кривых Каплана-Мейера. По оси X — время в днях от внедрения. По оси Y — доля необнаруженных уязвимостей (Survival Probability). На графике две нисходящие кривые: одна крутая (для уязвимостей в новом коде), другая пологая (для уязвимостей в legacy-коде). По оси Y от 1.0 до 0.0.]

Половина уязвимостей в новых модулях (моложе 6 месяцев) выявляются за 90 дней — кривая падает заметно быстрее. Для legacy (старше 2 лет) скорость обнаружения куда меньше: медианное время до обнаружения превышает 500 дней. Такая разница наглядно демонстрирует инертность работы с “залежами” старого кода.

Для проверки статистической значимости различий типов кода применяется log-rank тест. Если p-value меньше 0,05, различие не случайно и вызвано факторами из выборки.

Далее можно строить модели с разными ковариатами и рассчитывать Hazard Ratio (HR), показывающий влияние каждого фактора на скорость обнаружения:

HR > 1 — вероятность обнаружения уязвимости повышается (например, усиленные проверки или строгие регламенты).
HR < 1 — фактор увеличивает “выживаемость” уязвимости (например, малая заметность или недостаток тестов).

Такие выводы позволяют количественно сравнить, например, эффективность сканеров для разных типов уязвимостей, сравнить скорость обнаружения в зависимости от своей или внешней команды, глубины покрытых автотестами модулей и др.

Использование результатов в реальных процессах

Данные, полученные в результате Survival Analysis, ценны, только если на их основе меняют процессы обеспечения безопасности программного обеспечения.

Приоритизация аудитов и ревью. Если аналитика показала, что уязвимости в legacy-коде живут в 4 раза дольше, это аргумент для регулярных целевых проверок старых модулей даже в отсутствие развёртывания новых фич.
Оценка эффективности инструментов. Сравнение HR для результатов SAST и DAST позволяет понять, какой из подходов реально ускоряет выявление критичных проблем.
Оптимизация загрузки команд. Любой департамент может получить рациональные прогнозы — сколько новых уязвимостей, с каким средним сроком ожидать в следующем квартале, зная набор практик и скорость исправления.
Перераспределение ресурсов. Если анализ выявил “узкие места”, например, слишком большой latency выявления уязвимостей на клиентской стороне, есть смысл инвестировать в экспертизу и инструменты именно туда.

Рекомендация — начать эксперимент с одного ключевого продукта, пробно собрать данные хотя бы за полгода и обсудить итоговые метрики с командами. Даже одна конкретная цифра (“медианное время до обнаружения 220 дней”) наглядно показывает, где приоритезировать работу.

Ограничения метода и риски интерпретации

Несмотря на мощь модели, Survival Analysis имеет ряд существенных ограничений:

Неточность определения даты внедрения. Чаще всего используется дата коммита, однако уязвимость могла попасть через стороннюю библиотеку или из шаблона системы много лет назад. Это смещает baseline (“time_zero”).
Ограниченность детектирования. Анализ охватывает только уязвимости, которые реально были выявлены. Если инструмент или процесс не “видит” определённые классы проблем, их статистика искажается.
Динамика изменений. Такой признак, как владелец кода или его критичность, может меняться со временем. Стандартные (наивные) модели плохо работают с переменными признаками, и требуют расширения.
Корреляция не означает причинности. Высокий HR для модулей с автотестами не обязательно говорит о каузальной связи: возможно, оба признака отражают общую зрелость процесса в команде.

Задача специалиста по безопасности — критически относиться к полученным результатам, не делать поспешных выводов и не абсолютизировать любую цифру. Survival Analysis — инструмент формирования гипотез о внутреннем устройстве системы, а не абсолютная истина.