
Яндекс расширяет программу поиска уязвимостей и приглашает исследователей к участию в новом направлении «Охоты за ошибками», которое теперь охватывает генеративные нейросети. Впервые под прицел белых хакеров попадут модели YandexGPT, YandexART и вся инфраструктура, связанная с их работой.
За выявление серьёзных технических уязвимостей Яндекс готов платить до 1 миллиона рублей, в зависимости от их критичности и сложности воспроизведения. Что именно ищут в нейросетях В рамках нового этапа «Охоты» исследователи смогут сосредоточиться на технических сбоях и логических уязвимостях, которые могут повлиять на работу или обучение моделей.
В частности: Спровоцировать некорректное поведение модели Добиться её отказа или сбоя Получить доступ к внутренней конфигурации или служебным данным Нарушить работу других сервисов Яндекса через взаимодействие с моделью Максимальная выплата предусмотрена за уязвимости, которые позволяют получить чувствительную информацию, такую как технический системный промт, конфигурации модели или данные из защищённых разделов инфраструктуры.
Важно: в рамках этой программы принимаются только технические отчёты.
Жалобы на некорректные ответы голосового помощника Алиса или неудачные изображения в Шедевруме не рассматриваются.
Нейросети уже в 20+ сервисах Яндекса Модели YandexGPT и YandexART активно внедряются в экосистему Яндекса. На их основе работают более 20 пользовательских и бизнес-сервисов, включая: Алису Поиск с нейросетью Яндекс Директ Yandex Cloud API-интеграции для сторонних разработчиков Появление нейросетей в списке целей «Охоты за ошибками» — это шаг к открытой и независимой проверке безопасности, соответствующей строгим требованиям, которые Яндекс декларирует при разработке новых продуктов.
Безопасность — в основе подхода Компания подчёркивает, что создаёт свои технологии с учётом принципов безопасной разработки.
Безопасность проверяется на всех этапах — от архитектуры до внедрения.
Яндекс исследует потенциальные уязвимости ещё до релиза и внедряет защиту от атак на ИИ. Среди существующих мер защиты: Антиробот Яндекса — защита от DDoS-атак Центр мониторинга — выявление угроз и анализ подозрительной активности Регулярные внутренние аудиты — оценка уровня защищённости систем Теперь же верификация ИИ-систем дополнена ещё одним инструментом — открытой проверкой от внешних специалистов.