Anthropic представила Project Glasswing: інноваційну модель ШІ для кібербезпеки, яку не випускатимуть у публічний доступ.

Компанія Anthropic у вівторок анонсувала Project Glasswing — масштабну ініціативу з кібербезпеки, яка об’єднує новий, ще не випущений передовий ШІ-модель Claude Mythos Preview з коаліцією з дванадцяти провідних технологічних та фінансових компаній. Мета проєкту — виявлення та усунення програмних вразливостей у критично важливій глобальній інфраструктурі до того, як їх зможуть використати зловмисники.

Серед партнерів-засновників проєкту — Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia та Palo Alto Networks. Anthropic також надала доступ до своїх розробок понад 40 додатковим організаціям, що створюють або підтримують критично важливе програмне забезпечення. Компанія зобов’язалася надати кредити на використання Claude Mythos Preview на суму до 100 мільйонів доларів США, а також 4 мільйони доларів прямих пожертв для організацій, що займаються безпекою у сфері відкритого програмного забезпечення.

Цей анонс відбувається на тлі надзвичайного динамізму та одночасно підвищеної уваги до стартапу Anthropic. Минулої неділі компанія повідомила, що її річна виручка сягнула понад 30 мільярдів доларів США, що значно перевищує показник приблизно 9 мільярдів доларів на кінець 2025 року. Кількість бізнес-клієнтів, які щорічно витрачають понад 1 мільйон доларів, перевищила 1000, подвоївшись менш ніж за два місяці. Одночасно було оголошено про угоду щодо обчислювальних потужностей на кілька гігават з Google та Broadcom. Того ж дня Bloomberg повідомив, що Anthropic переманила високопоставленого керівника Microsoft, Еріка Бойда, для управління розширенням інфраструктури компанії.

Однак Glasswing — це щось принципово відмінне від фінансових показників чи угод щодо обчислювальних ресурсів. Це найамбітніша спроба Anthropic використати можливості передових ШІ — можливості, які, за словами самої компанії, є небезпечними — для отримання оборонної переваги, перш ніж ці ж можливості потраплять до рук ворожих акторів.

Чому Anthropic створила модель, яку вважає надто небезпечною для публічного випуску

В основі Project Glasswing лежить Claude Mythos Preview — універсальна передова модель, яка, за заявами Anthropic, вже виявила тисячі високопріоритетних вразливостей нульового дня (zero-day vulnerabilities) — тобто дефектів, невідомих розробникам програмного забезпечення — у всіх основних операційних системах, браузерах та іншому критично важливому програмному забезпеченні.

Компанія не планує надавати цю модель широкому загалу.

"Ми не плануємо робити Claude Mythos Preview загальнодоступним через його можливості в галузі кібербезпеки", — заявив Ньютон Ченг, керівник відділу кібербезпеки Frontier Red Team у Anthropic, в ексклюзивному інтерв’ю VentureBeat. "Однак, враховуючи темпи розвитку ШІ, незабаром такі можливості поширяться, потенційно виходячи за межі акторів, які прагнуть безпечного їх розгортання. Наслідки — для економіки, громадської безпеки та національної безпеки — можуть бути серйозними".

Ці слова — "наслідки можуть бути серйозними" — вражають, коли вони походять від компанії, що створила цю модель. Anthropic фактично стверджує, що інструмент, який вона розробила, є настільки потужним, що здатен докорінно змінити ландшафт кібербезпеки, і єдиний відповідальний шлях — це обмежити його використання, надавши захисникам перевагу.

Технічні результати підтверджують це твердження. Згідно з пресрелізом Anthropic, Mythos Preview здатна виявляти майже всі виявлені вразливості та розробляти багато пов’язаних експлойтів повністю автономно, без будь-якого людського втручання. Особливо виділяються три приклади: модель виявила 27-річну вразливість у OpenBSD — широко визнаній одній з найбезпечніших операційних систем у світі, яка часто використовується для роботи міжмережевих екранів та критичної інфраструктури. Цей дефект дозволяв зловмиснику віддалено вивести з ладу будь-яку машину, що працює під управлінням цієї ОС, просто підключившись до неї. Також було виявлено 16-річну вразливість у FFmpeg — майже універсальній бібліотеці для кодування та декодування відео — у рядку коду, який автоматизовані інструменти тестування перевіряли п’ять мільйонів разів, жодного разу не виявивши проблему. І, що, можливо, найтривожніше, Mythos Preview самостійно виявила та поєднала кілька вразливостей у ядрі Linux, що дозволило підвищити привілеї від звичайного користувача до повного контролю над системою.

Усі три вразливості були повідомлені відповідним супроводжувачам і відтоді виправлені. Щодо багатьох інших вразливостей, які ще перебувають на стадії виправлення, Anthropic повідомляє, що публікує їх криптографічні геші сьогодні, з планами розкрити специфіку після запровадження виправлень.

За результатами оцінки на бенчмарку CyberGym, Mythos Preview показала 83.1%, порівняно з 66.6% у Claude Opus 4.6, наступної найкращої моделі Anthropic. Розрив ще більший за показниками програмування: Mythos Preview досягає 93.9% на SWE-bench Verified проти 80.8% у Opus 4.6, та 77.8% на SWE-bench Pro проти 53.4%.

Як Anthropic планує розкривати тисячі zero-day вразливостей, не перевантажуючи розробників відкритого ПЗ

Виявлення тисяч вразливостей нульового дня одночасно звучить вражаюче. Однак відповідальне управління цими даними є логістичним кошмаром — і одним з найгостріших критичних зауважень з боку дослідників безпеки щодо виявлення вразливостей за допомогою ШІ. Перевантаження супроводжувачів відкритого програмного забезпечення, багато з яких є неоплачуваними волонтерами, лавиною критичних звітів про помилки може легко принести більше шкоди, ніж користі.

Ченг повідомив VentureBeat, що Anthropic розробила конвеєр сортування (triage pipeline) спеціально для вирішення цієї проблеми. "Ми сортуємо кожну виявлену нами помилку, а потім надсилаємо найвищої пріоритетності помилки професійним людським сортувальникам, яких ми найняли для допомоги в процесі розкриття, шляхом ручної перевірки кожного звіту про помилку, перш ніж надіслати його розробникам, щоб гарантувати, що ми надсилаємо лише високоякісні звіти", — сказав він.

Цей конвеєр розроблений для запобігання саме тому сценарію, якого найбільше бояться супроводжувачі: автоматичний потік неперевірених звітів. "Ми не надсилаємо великі обсяги знахідок одному проєкту, не зв’язавшись попередньо, щоб узгодити темп, який супроводжувач зможе витримати", — додав Ченг.

Коли Anthropic має доступ до вихідного коду, компанія прагне додати кандидатний патч до кожного звіту, позначений походженням — тобто супроводжувач знатиме, що патч був написаний або перевірений моделлю. Компанія пропонує співпрацювати над створенням патча виробничої якості. "Моделі можуть писати патчі, — зазначив Ченг, — але існує багато факторів, що впливають на якість патча, і ми наполегливо рекомендуємо, щоб автономно написані патчі проходили таку ж перевірку та тестування, як і написані людьми".

Щодо термінів розкриття, Anthropic дотримується рамкової угоди про скоординоване розкриття вразливостей (coordinated vulnerability disclosure). Після доступності патча компанія зазвичай чекає 45 днів перед публікацією повної технічної інформації, надаючи користувачам час для розгортання виправлення до того, як інформація про експлуатацію стане загальнодоступною. Ченг зазначив, що компанія може скоротити цей термін, "якщо деталі вже є загальновідомими через інші канали, або якщо раннє розкриття суттєво допоможе захисникам виявити та пом’якшити поточні атаки", або продовжити його, "коли розгортання патча є надзвичайно складним або уражена ділянка надзвичайно широка".

Це розумні принципи, але вони будуть перевірені в масштабах, яких жодна програма розкриття вразливостей ніколи не намагалася реалізувати. Величезний обсяг знахідок — тисячі zero-day вразливостей у всіх основних платформах — означає, що навіть добре розроблений процес сортування зіткнеться з вузькими місцями. А 45-денний термін розкриття передбачає, що супроводжувачі зможуть фактично створити, протестувати та випустити патч за цей час, що зовсім не гарантовано для складних помилок на рівні ядра або глибоко вбудованих криптографічних дефектів.

Витік вихідного коду, помилка CMS та чому довіра є найсерйознішою вразливістю Anthropic

Іронія полягає в тому, що компанія, яка стверджує, ніби створює найпотужнішу модель кібербезпеки в історії, одночасно зазнає низки прикрих провалів у безпеці. Цього не могли не помітити спостерігачі.

Наприкінці березня чернетка допису в блозі про Mythos була залишена в незахищеному та загальнодоступному сховищі даних — неправильна конфігурація CMS, яка викрила приблизно 3000 внутрішніх активів, включаючи, здавалося б, стратегічні плани розгортання моделі. Через кілька днів, 31 березня, будь-хто, хто запускав npm install на Claude Code, завантажував повний оригінальний вихідний код Anthropic — 512 000 рядків — протягом приблизно трьох годин через помилку пакування. Цей інцидент привернув широку увагу в спільноті розробників і був вперше висвітлений VentureBeat.

Коли його запитали, чому партнери та уряди мають довіряти Anthropic як хранителю моделі, яку вона описує як таку, що має безпрецедентні кіберможливості, Ченг відповів прямо. "Безпека є центральною у тому, як ми будуємо та випускаємо продукти", — сказав він VentureBeat. "Ці два інциденти — неправильна конфігурація CMS блогу та помилка пакування npm — були людськими помилками в інструментах публікації, а не порушеннями нашої архітектури безпеки. Ми внесли зміни, щоб запобігти їх повторенню, і будемо продовжувати вдосконалювати наші процеси".

Це технічно точне розрізнення — жоден з інцидентів не передбачав порушення основних вагових коефіцієнтів моделі Anthropic, інфраструктури навчання чи систем API, — але це також розрізнення, яке може виявитися складним для обґрунтування в публічному полі. Для організації, яка просить урядів та компаній зі списку Fortune 500 довірити їй інструмент, що може автономно виявляти та експлуатувати вразливості в ядрі Linux, навіть незначні операційні провали несуть непропорційно високі репутаційні ризики. Той факт, що сам витік інформації про Mythos вперше повідомив спільноту безпеки про існування моделі, за кілька тижнів до запланованого анонсу, підкреслює це.

Що виявили Microsoft, CrowdStrike та Linux Foundation під час тестування моделі

Широта коаліції заслуговує на увагу. Вона включає прямих конкурентів — Google та Microsoft — поряд із гігантами кібербезпеки, фінансовими установами та опікуном найбільшої у світі екосистеми відкритого програмного забезпечення. Кілька партнерів вже тижнями тестують Mythos Preview на своїх власних системах.

Технічний директор CrowdStrike Еліа Зайцев охарактеризував ініціативу через скорочення часових рамок: "Часовий проміжок між виявленням вразливості та її експлуатацією зловмисником скоротився — те, що колись займало місяці, тепер відбувається за хвилини за допомогою ШІ". Віцепрезидент та директор з інформаційної безпеки AWS Емі Герцог зазначила, що її команди вже тестують Mythos Preview на критично важливих кодових базах, де модель "вже допомагає нам зміцнювати наш код". А глобальний директор з інформаційної безпеки Microsoft Ігор Циганський зазначив, що при тестуванні на CTI-REALM, відкритому бенчмарку безпеки Microsoft, "Claude Mythos Preview показав суттєві покращення порівняно з попередніми моделями".

Мабуть, найпоказовішим коментарем був коментар Джима Земліна, генерального директора Linux Foundation, який наголосив на фундаментальній нерівності, що вже десятиліттями переслідує безпеку відкритого програмного забезпечення: "У минулому експертиза з безпеки була розкішшю, доступною лише для організацій з великими командами безпеки. Супроводжувачі відкритого програмного забезпечення — чиє програмне забезпечення лежить в основі значної частини критичної інфраструктури світу — історично були змушені самостійно вирішувати питання безпеки". Project Glasswing, за його словами, "пропонує реалістичний шлях до зміни цієї ситуації".

Щоб підкріпити це твердження фінансово, Anthropic повідомляє, що пожертвувала 2,5 мільйона доларів США Alpha-Omega та OpenSSF через Linux Foundation, і 1,5 мільйона доларів США Apache Software Foundation. Розробники, зацікавлені в доступі, можуть подати заявку через програму Anthropic Claude for Open Source.

Вартість, угода щодо обчислювальних потужностей та шлях Anthropic до потенційного IPO

Після періоду попереднього перегляду досліджень — протягом якого зобов’язання Anthropic щодо кредитів на суму 100 мільйонів доларів США покриватимуть більшість витрат на використання — Claude Mythos Preview буде доступний учасникам за ціною 25 доларів США за мільйон вхідних токенів і 125 доларів США за мільйон вихідних токенів. Учасники зможуть отримати доступ до моделі через Claude API, Amazon Bedrock, Google Cloud Vertex AI та Microsoft Foundry.

Ці ціни відображають обчислювальну інтенсивність моделі. У чернетці допису в блозі, що просочилася в березні, Mythos описувалася як велика, обчислювально-інтенсивна модель, обслуговування якої буде дорогим як для Anthropic, так і для її клієнтів. Рішення Anthropic полягає в розробці та запуску нових заходів безпеки з майбутньою моделлю Claude Opus, що дозволить компанії "покращувати та вдосконалювати їх за допомогою моделі, яка не становить такого ж рівня ризику, як Mythos Preview", як розповів Ченг VentureBeat. Фахівці з безпеки, чия легітимна робота буде ускладнена цими заходами безпеки, зможуть подати заявку до майбутньої програми Cyber Verification Program.

Фінансовий контекст має значення. Того ж дня, коли був запущений Project Glasswing, Anthropic розкрила свої фінансові показники та угоду щодо обчислювальних потужностей з Google-Broadcom. Broadcom підписала розширену угоду з Anthropic, яка надасть ШІ-стартапу доступ до обчислювальних потужностей приблизно на 3,5 гігавата, використовуючи ШІ-процесори Google, повідомляє CNBC. Масштаб задіяних обчислювальних ресурсів є вражаючим — і це пояснює, чому Anthropic потребує як доходів від партнерств у сфері кібербезпеки для підприємств, так і інфраструктури для обслуговування моделі такого масштабу, як Mythos Preview.

Час також збігається зі зростанням спекуляцій щодо шляху Anthropic до публічного розміщення акцій (IPO). Компанія, за повідомленнями, розглядає можливість IPO вже у жовтні 2026 року. Гучна, пов’язана з урядом ініціатива з кібербезпеки з провідними партнерами — це саме той тип програми, який покращує наратив IPO, особливо коли компанія може одночасно вказувати на 30 мільярдів доларів річної виручки та обчислювальну потужність, що вимірюється гігаватами.

Anthropic стверджує, що захисники мають місяці, а не роки, доки противники не наздоженуть

Найбільш значущим питанням, яке ставить Project Glasswing, є не те, чи справді можливості Mythos Preview реальні — партнерські схвалення та виправлені вразливості свідчать про це, — а скільки часу насправді мають захисники, перш ніж подібні можливості стануть доступними для противників.

Ченг був відвертим щодо часових рамок. "Можливості передових ШІ, ймовірно, суттєво покращаться протягом наступних кількох місяців", — сказав він VentureBeat. "Враховуючи темпи розвитку ШІ, незабаром такі можливості поширяться, потенційно виходячи за межі акторів, які прагнуть безпечного їх розгортання". Він описав Project Glasswing як "важливий крок до надання захисникам стійкої переваги в епоху кібербезпеки, керованої ШІ", але додав важливе застереження: "Важливо зазначити, що це лише початок. Жодна організація не може вирішити ці проблеми кібербезпеки самостійно".

Цю перспективу — місяці, а не роки — варто сприймати серйозно. DARPA запустила свій оригінальний Cyber Grand Challenge у 2016 році, змагання зі створення автоматизованих систем захисту, здатних аналізувати дефекти, формулювати патчі та розгортати їх у мережі в реальному часі. Тоді штучний інтелект-бот-переможець Mayhem посів останнє місце серед команд людей на DEF CON. Через десятиліття Anthropic стверджує, що передова модель ШІ може виявляти вразливості, які пережили 27 років експертного людського аналізу та мільйони автоматизованих тестів безпеки — і може самостійно поєднувати експлойти для досягнення повного компромету системи.

Різниця між цими двома точками даних ілюструє, чому галузь розглядає це як справжню переломну подію, а не маркетинговий хід. Anthropic має власний досвід роботи з наступальною стороною цього рівня: у листопаді 2025 року компанія повідомила, що китайська група, яка спонсорується державою, досягла 80-90% автономного тактичного виконання за допомогою Claude приблизно на 30 цілях, згідно зі звітом Anthropic про зловживання.

Project Glasswing з’являється в один із найтурбулентніших тижнів в історії Anthropic. За кілька днів компанія анонсувала модель, яку вважає занадто небезпечною для публічного випуску, повідомила про потрійне зростання виручки, уклала угоду про обчислювальні потужності на гігавати, найняла старшого керівника Microsoft, зробила використання сторонніх інструментів, таких як OpenClaw, дорожчим для підписників Claude Code, і пережила масштабний збій свого чат-бота Claude у вівторок вранці. Anthropic обіцяє опублікувати звіти про отримані уроки протягом 90 днів. У середньостроковій перспективі компанія запропонувала, щоб незалежний сторонній орган міг стати ідеальним домом для продовження роботи над великомасштабними проєктами з кібербезпеки.

Чи буде щось із цього достатньо швидким, залежить від гонки, яка вже триває. Anthropic створила модель, яка може автономно зламувати найзахищеніші операційні системи планети — і тепер робить ставку на те, що обмін нею із захисниками, під суворими обмеженнями, принесе більше користі, ніж неминучий момент, коли подібні можливості потраплять до менш обережних рук. Це, по суті, ставка на те, що прозорість може випередити поширення. Наступні кілька місяців покажуть, чи окупиться ця ставка, чи крила скляної птиці (glasswing) ніколи не були достатньо непрозорими, щоб приховати те, що наближається.

Прогноз ІТ-Блогу: Створення таких спеціалізованих, потужних ШІ-моделей, як Claude Mythos Preview, для виявлення вразливостей, ймовірно, призведе до появи нових стандартів у кібербезпеці, де машинне навчання стане невід’ємною частиною оборони. Ми очікуємо, що такі проєкти стимулюватимуть розробку більш ефективних інструментів для захисту, а також посилять дискусію про етичні норми ШІ у сфері безпеки.

Джерело новини: venturebeat.com