Проект Glasswing: почему Anthropic ограничивает Mythos

Я уже какое-то время слежу за выпусками моделей Anthropic, и анонс 7 апреля стал первым, который заставил меня по-настоящему остановиться и перечитать его дважды.

Не потому что Claude Mythos Preview «мощная» — это слово применяли к каждому релизу модели на протяжении двух лет. Но потому что Anthropic сделала кое-что необычное: они создали возможность, пришли к выводу, что выпускать её слишком рискованно, и вместо этого организовали ограниченную программу, специально предназначенную для использования этой возможности в целях защиты — до того, как атакующие поймут, что отстают. Это совершенно другой подход. Project Glasswing стоит понять чётко — не как PR-историю, а как окно в то, как на самом деле разворачивается управление передовым ИИ.

Я ваш друг, Дора. Вот что подтверждено, что это значит и что строители должны из этого извлечь.

Что такое Project Glasswing

Программа управляемого доступа Anthropic для Claude Mythos Preview

Project Glasswing — это инициатива Anthropic по развёртыванию Claude Mythos Preview — их наиболее мощной на сегодняшний день модели — специально для оборонительной работы в области кибербезопасности. Модель не находится в открытом доступе. Доступ ограничен избранной группой организаций, работающих с критической программной инфраструктурой.

Среди партнёров по запуску, названных Anthropic, — AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks. Помимо этих названных партнёров, Anthropic расширила доступ ещё более чем на 40 организаций, создающих или обслуживающих критическую программную инфраструктуру.

Цель: дать защитникам фору

Формулировка Anthropic недвусмысленна: те же возможности, которые делают ИИ-модели опасными в чужих руках, делают их бесценными для поиска и исправления уязвимостей в важном программном обеспечении — и для создания нового программного обеспечения с гораздо меньшим количеством ошибок безопасности.

В этом и состоит вся суть. Модель, способная автономно находить уязвимости нулевого дня, одновременно является самым полезным инструментом безопасности из когда-либо созданных и одной из самых опасных наступательных возможностей. Project Glasswing — это попытка дать стороне защиты возможность действовать первой.

Что уже было найдено

Это не умозрительно. За последние несколько недель Anthropic использовала Claude Mythos Preview для выявления тысяч уязвимостей нулевого дня — брешей, ранее неизвестных разработчикам программного обеспечения, — многие из которых критические, во всех основных операционных системах и браузерах, а также в ряде других важных программных компонентов.

Один конкретный пример из блога Anthropic Frontier Red Team: Mythos Preview полностью автономно выявила и использовала 17-летнюю уязвимость удалённого выполнения кода во FreeBSD (CVE-2026-4747), которая позволяет любому получить права root на машине, работающей под управлением NFS, — начиная с неаутентифицированной позиции в любой точке интернета. После первоначального запроса человек не участвовал.

Обязательство на 90 дней

Это деталь, которую большинство публикаций недооценило. Anthropic взяла на себя явное обязательство: в течение 90 дней они публично отчитаются о том, что узнали, а также об исправленных уязвимостях и улучшениях, которые можно раскрыть. Это ограниченное по времени публичное обязательство — не расплывчатое «мы поделимся результатами со временем». Это означает, что к началу июля 2026 года должен быть реальный отчёт о том, что эта программа нашла и исправила.

Почему Anthropic выбрала такой подход

Проблема двойного использования, изложенная прямо

Это основная логика, и она заслуживает осмысления. Модель, способная автономно находить и эксплуатировать уязвимости программного обеспечения, — это не просто мощный инструмент безопасности, это мощный инструмент атаки. Эта возможность не поставляется с детектором намерений. Широкое распространение Mythos Preview означает широкое распространение возможности компрометировать критическую инфраструктуру.

В этом и состоит проблема двойного использования. Дело не в том, что Anthropic не доверяет разработчикам. Дело в том, что широкодоступная модель, способная выстраивать цепочки уязвимостей нулевого дня и писать рабочие эксплойты, создаёт профиль риска, который ни один ответственный игрок не может игнорировать — вне зависимости от того, кто спрашивает. В системной карточке Mythos Preview это сказано прямо: «Значительное увеличение возможностей Claude Mythos Preview привело нас к решению не делать её общедоступной».

«Поразительно способная» — и что это на самом деле означает

Язык Anthropic здесь намеренен. Они не назвали Mythos Preview «постепенно лучше в задачах безопасности». Слово, которое они использовали, — «поразительно способная». Модель способна в одиночку выполнять сложные и эффективные задачи взлома — выявлять несколько нераскрытых уязвимостей, писать код для их эксплуатации и объединять их в цепочки для проникновения в сложное программное обеспечение.

Mythos Preview также фактически насытила существующие внутренние и внешние бенчмарки, которые Anthropic использовала для отслеживания возможностей модели, что вынудило перейти к тестированию на новых реальных задачах. Когда ваша модель перерастает ваш набор оценок, вы оказываетесь на подлинно новой территории.

Чем это ограничение явно не является

Здесь стоит быть точными, потому что формулировка имеет значение. Это не Anthropic, накапливающая возможности. Это не конкурентный манёвр. Ограничение существует потому, что асимметрия вреда от широкого распространения резко смещается в отрицательную сторону в краткосрочной перспективе: защитникам нужны координация и время для патчинга; атакующим нужна только модель.

Выпуская эту модель изначально ограниченной группе критических отраслевых партнёров, Anthropic стремится дать защитникам возможность начать защиту наиболее важных систем до того, как модели с аналогичными возможностями станут широко доступны.

Логика здесь — в последовательности, а не в секретности.

Что делают участники Glasswing

Сфера деятельности

Партнёры используют Claude Mythos Preview специально для оборонительной безопасности — поиска и устранения уязвимостей в системах, которыми они владеют или которые обслуживают. Сфера деятельности распространяется на собственные кодовые базы и системы с открытым исходным кодом. Включение Linux Foundation особенно примечательно именно потому, что значительная часть критической инфраструктуры работает на программном обеспечении с открытым исходным кодом, которое исторически недополучало ресурсы для обеспечения безопасности.

Что говорят партнёры

Заявление Cisco с официальной страницы Glasswing: работа показала, что они могут выявлять и устранять уязвимости безопасности в аппаратном и программном обеспечении с темпом и масштабом, ранее невозможными. Microsoft отметила, что модель уже помогает укреплять код в критических кодовых базах. AWS описала применение её в рамках технологического стека, обрабатывающего более 400 триллионов сетевых потоков ежедневно.

Это не демонстрационные отзывы. Это производственные команды безопасности, описывающие реальное использование.

Ресурсные обязательства

Anthropic взяла на себя обязательство выделить $100 млн в кредитах на использование модели для участников Project Glasswing в рамках исследовательского превью, а также $4 млн в виде прямых пожертвований организациям по безопасности открытого исходного кода. Доступ оценивается в $25/$125 за миллион входных/выходных токенов через Claude API, Amazon Bedrock, Google Cloud’s Vertex AI и Microsoft Foundry.

Что это говорит нам о стратегии выпуска Anthropic

Выпуски с ограничениями по безопасности теперь реальны

До Glasswing «мы будем осторожны в выпуске этого» было в основном теоретическим языком. Теперь это операционно. Anthropic создала возможность, оценила её, решила, что профиль риска исключает общую доступность, и организовала альтернативу, которая всё же создаёт ценность при управлении недостатком. Это шаблон.

Практическая импликация: не каждая передовая возможность будет следовать публичному выпуску API. Некоторые возможности — особенно те, которые имеют очевидный потенциал двойного использования — могут быть ограничены управляемыми программами с доступом, обусловленным типом организации, сценарием использования или уровнем безопасности.

Чем это отличается от стандартной беты

Обычная бета API касается готовности: модель не совсем стабильна, документация неполная, нужна обратная связь перед общим выпуском. Glasswing категорически отличается. Модель готова. Проблема в том, что произойдёт, если она будет широко развёрнута до того, как у защитников будет время её использовать. Ограничение касается последовательности воздействия, а не технической зрелости.

Это различие важно для того, как вы думаете о том, что означает «доступ» к передовым моделям в будущем.

Что будет после Glasswing

Anthropic заявила, что не планирует делать Mythos Preview общедоступной. Их заявленная цель — в конечном итоге обеспечить безопасное развёртывание моделей класса Mythos в масштабе — но для этого необходимо разработать средства защиты кибербезопасности, которые смогут обнаруживать и блокировать наиболее опасные выходные данные модели. Они планируют запустить новые средства защиты с предстоящей моделью Claude Opus, используя её для улучшения и доработки этих средств защиты с моделью, не несущей такого же профиля риска.

Перевод: существует дорожная карта разработки безопасности, которая должна предшествовать более широкому доступу. Публичный отчёт за 90 дней станет первой реальной точкой данных о том, продвигается ли эта дорожная карта.

Последствия для строителей и экосистемы

Что ограниченные передовые модели означают для вас

Если вы строите на ИИ — будь то как руководитель инфраструктуры, владелец продукта или технический основатель — Glasswing является первым конкретным сигналом того, что модель доступа к передовым возможностям раздваивается. Публичные API продолжат охватывать большинство сценариев использования. Но для возможностей на переднем крае риска двойного использования управляемые программы доступа с организационной проверкой могут стать стандартом.

Это не обязательно плохо для строителей. Альтернатива — отсутствие доступа — хуже. Но это означает, что путь к передовым возможностям для чувствительных областей всё больше будет требовать демонстрации организационного соответствия, а не только технической готовности.

Что Glasswing сигнализирует о будущих высококвалифицированных моделях

Паттерн, который Anthropic установила с Glasswing, почти наверняка будет применён снова. Когда будущая модель продемонстрирует возможности, создающие значимый риск двойного использования — будь то в биологии, химии, кибербезопасности или других областях — ожидайте той же последовательности: ограниченный доступ для защитников и исследователей, определённый срок прозрачности и публичная отчётность перед любым более широким развёртыванием.

Anthropic отметила, что эта работа может занять годы, и что передовые возможности ИИ, вероятно, существенно продвинутся за это время. Это не единовременный крайний случай. Это начало паттерна управления.

Часто задаваемые вопросы

Кто имеет право на доступ к Project Glasswing?

Текущая сфера охватывает две группы: названных партнёров по запуску (крупные технологические и охранные компании, публично перечисленные Anthropic) и более 40 дополнительных организаций, создающих или обслуживающих критическую программную инфраструктуру. На официальной странице Glasswing на момент написания этой статьи не описано публичного процесса подачи заявок.

Могу ли я подать заявку на Glasswing как независимый исследователь?

Текущая формулировка является организационной, а не индивидуальной. Независимые исследователи не исключены в принципе — разработчики открытого исходного кода упоминаются явно — но путь доступа проходит через организации, обслуживающие критическое программное обеспечение, а не через отдельных исследователей. Если это изменится, об этом, вероятно, будет объявлено через официальную страницу Glasswing.

Станет ли Claude Mythos в конечном итоге общедоступной?

Anthropic заявила, что не планирует делать Mythos Preview общедоступной. Будущая модель с возможностями класса Mythos может стать доступной после того, как необходимые средства защиты безопасности будут разработаны и валидированы — но публичных сроков для этого нет.

Что делает Mythos достаточно отличной, чтобы требовать ограниченного выпуска?

Две вещи: автономные возможности и масштаб. Предыдущие модели могли помогать в задачах безопасности. Mythos Preview может выстраивать цепочки уязвимостей, писать рабочие эксплойты и выявлять ранее неизвестные ошибки во всех основных ОС и браузерах — без участия человека после первоначального запроса. Это качественно иной профиль риска.

Делала ли Anthropic подобные ограниченные выпуски раньше?

Не в таком масштабе и не с такой явной формулировкой безопасности. Предыдущие ограниченные выпуски были стандартными бетами или корпоративными программами. Glasswing — первый случай, когда Anthropic публично заявила: эта возможность слишком опасна для широкого выпуска, и вот структурированная альтернатива. Это ново.

Продолжение следует — публичный отчёт за 90 дней является следующей реальной точкой данных. Стоит следить.

Предыдущие посты: