Ультразвук как скрытый канал передачи данных между изолированными приложениями

«Общая идея архитектуры безопасности, где каждое приложение сидит в своей песочнице, разбивается о простой физический факт: динамик и микрофон в устройстве, это общие ресурсы. Система может спросить у тебя разрешение на микрофон, но не может отличить запись твоего голоса от приёма цифровых данных, посланных другим приложением через ультразвук. Это не баг, а фундаментальное свойство, превращающее звук в скрытый канал связи, который обходит все программные барьеры.»

Как звук стал скрытым каналом для данных

Современные мобильные и настольные операционные системы построены на модели изоляции процессов. Каждое приложение работает в своём контейнере с чётко определёнными правами доступа к файлам, сети и оборудованию. Этот принцип — основа безопасности, но у него есть системная слабость: некоторые аппаратные компоненты по своей природе являются глобальными. Микрофон — самый яркий пример.

Когда приложение запрашивает доступ к микрофону, система показывает диалоговое окно. Разрешение даётся на всё приложение целиком и не имеет временных или семантических ограничений. Получив доступ, приложение видит необработанный аудиопоток. Для операционной системы не имеет значения, что именно передаётся в этом потоке — голосовые команды, фоновый шум или модулированный цифровой сигнал. Она лишь предоставляет доступ к аппаратному интерфейсу.

Ультразвуковой диапазон начинается выше порога слышимости человека — примерно с 20 000 Герц. Многие микрофоны и динамики в потребительской электронике, особенно в смартфонах среднего и высокого ценового сегмента, способны работать с частотами вплоть до 22-24 кГц, а иногда и выше. Этого достаточно, чтобы превратить стандартное аудиооборудование в примитивный беспроводной модем.

Механика ультразвуковой передачи между устройствами

Для работы скрытого канала нужно два компонента: передатчик и приёмник. Передатчиком может быть любое устройство со встроенным динамиком — ноутбук, умная колонка или даже телевизор в общественном месте. На нём запускается код, который кодирует данные в последовательность тонов в ультразвуковом диапазоне и транслирует их.

Приёмником выступает смартфон или планшет с приложением, имеющим разрешение на доступ к микрофону. Это приложение в фоне постоянно анализирует аудиопоток, используя библиотеки для обработки сигналов, такие как AudioTrack на Android или AVFoundation на iOS. Оно ищет заранее определённые паттерны, декодирует их и извлекает полезную нагрузку, это может быть идентификатор, токен или команда.

Кодирование данных чаще всего использует методы, унаследованные от телекоммуникаций: частотную манипуляцию или фазовый сдвиг. Простейший вариант — использовать две разные ультразвуковые частоты для кодирования нуля и единицы.

Сценарии использования: от аналитики до атак

Эта технология не была изобретена для взлома. Изначально она рассматривалась для удобных сценариев, что и сделало её легитимной и доступной:

Кросс-устройственная синхронизация. Бесконтактная передача настроек или сессионных данных между телефоном и ноутбуком в одной комнате без Wi-Fi и Bluetooth.
Привязка онлайн-действий к офлайн-событиям. Рекламные платформы внедряли в телевизионную рекламу ультразвуковые маяки. Приложение на смартфоне, услышав этот сигнал, могло показать пользователю релевантный контент или зафиксировать факт просмотра, связывая разные среды взаимодействия.

Однако те же принципы открывают возможности для скрытных операций:

Обход изоляции на одном устройстве. Два приложения, установленные на одном смартфоне, не могут обмениваться данными через санкционированные API. Но если одно имеет доступ на запись звука (например, для шумоподавления), а другое — на чтение с микрофона, они могут организовать связь через ультразвук, используя динамик и микрофон как мост. Так происходит утечка данных между изолированными песочницами.
Перехват данных сессии. Наиболее опасный сценарий. Если на рабочем компьютере, с которого выполняется вход в критичный веб-сервис, работает вредоносная программа, она может попытаться перехватить токен авторизации или одноразовый код. Передав его через ультразвук на смартфон под контролем злоумышленника, можно получить доступ к аккаунту, минуя сетевые средства защиты.

Почему разрешения системы не являются защитой

Традиционная модель безопасности работает с принципом наименьших привилегий. Но в случае с микрофоном привилегия неделима: это доступ ко всему звуковому окружению. Система не может отфильтровать только «человеческую речь» из потока. Если вредоносное приложение получило доступ к микрофону, оно получает всё, что может уловить датчик, включая звуки, сгенерированные другими, «доверенными» приложениями через динамик.

Разрешения стали ритуалом, который пользователь часто выполняет не задумываясь. Диалог «Приложению X требуется доступ к микрофону» не объясняет, зачем именно — для голосового вызова, для поиска музыки или для фонового сканирования ультразвуковых маяков. Одноразовое разрешение даёт постоянный доступ, который сложно контролировать постфактум.

Технические и практические ограничения

Ультразвуковой канал — не волшебная палочка. Его эффективность серьёзно ограничена рядом факторов:

Ограничение	Описание	Влияние на атаку
Дальность и среда	Ультразвук сильно поглощается воздухом и мягкими материалами. Эффективная дальность редко превышает несколько метров в пределах прямой видимости.	Атака возможна только в непосредственной близости, например, в одном кабинете.
Аппаратные фильтры	Некоторые производители встраивают в микрофоны аналоговые фильтры низких частот, обрезающие сигнал выше 18-20 кГц для улучшения качества голосовой связи.	Такие устройства неуязвимы для типичных ультразвуковых атак.
Шум и помехи	Фоновая музыка, разговоры, шум вентиляции создают помехи в том же частотном диапазоне.	Требует более сложных и энергозатратных алгоритмов кодирования, снижает скорость и надёжность передачи.
Энергопотребление	Непрерывный анализ аудиопотока в реальном времени с преобразованием Фурье — ресурсоёмкая задача.	Быстро разряжает аккумулятор, что может привлечь внимание пользователя.

Меры противодействия на разных уровнях

Для пользователей

Детальный аудит разрешений. Не ограничивайтесь первичной настройкой. Регулярно проверяйте, какие приложения имеют доступ к микрофону в настройках приватности. Отзывайте разрешения у всего, что не подразумевает голосового взаимодействия по своей сути.
Использование визуальных индикаторов. Современные ОС отображают индикатор (точку или значок в строке состояния), когда микрофон активен. Если индикатор горит в неожиданный момент, это повод немедленно проверить запущенные приложения.
Принцип разделения устройств. Для работы с критичными данными (например, с электронными подписями) используйте устройства без микрофонов или с физически отключаемыми датчиками.

Для разработчиков и администраторов

Анализ поведения приложений. Подозрительной считается фоновая активность приложения, которое постоянно обращается к аудио API без запуска пользователем функций записи.
Системные фильтры. На уровне операционной системы можно внедрить программный фильтр, обрезающий ультразвуковую часть спектра перед передачей потока приложению, если его основная функция — работа с голосом.
Контекстные запросы разрешений. Вместо одноразового запроса доступ можно запрашивать контекстно — только в момент, когда пользователь явно нажимает кнопку «Записать голос». Это сложнее в реализации, но эффективнее.

Ультразвуковой канал, это пример того, как абстрактная модель безопасности сталкивается с физической реальностью. Это не «дыра», которую можно просто «запатчить», а фундаментальный вызов для архитекторов систем. Понимание этого механизма меняет взгляд на разрешения: доступ к микрофону, это не просто возможность записать разговор, это потенциальный ключ к скрытому обмену данными, который обходит все логические границы между приложениями.