Anthropic запускає Claude Fable 5: найпотужніша модель для всіх тепер доступна

Компанія Anthropic представила два нові ШІ-моделі — Claude Fable 5 та Claude Mythos 5. Це перший випуск потужних можливостей “класу Mythos” для широкого загалу, раніше доступних лише учасникам програми безпеки Project Glasswing.

Claude Fable 5: Новий стандарт ефективності

Claude Fable 5, призначена для більшості користувачів та розробників, перевершує всі попередні моделі Claude за показниками у сферах розробки програмного забезпечення, аналітичної роботи, обробки зображень, наукових досліджень та тривалих завдань. Вона демонструє значне покращення результатів, перевершуючи актуальні бенчмарки, хоча попередні версії Claude Mythos Preview зберігають лідерство в окремих категоріях, таких як комп’ютерне використання та багатодисциплінарне мислення.

Claude Mythos 5: Розширені можливості для спеціалізованих завдань

Claude Mythos 5 є вдосконаленою версією попередньої моделі Mythos Preview, з дещо знятими обмеженнями для схвалених користувачів, зокрема партнерів Anthropic з кібербезпеки в рамках Project Glasswing та обраних дослідників у галузі біології. Основна відмінність полягає в тому, що Fable 5, будучи загальнодоступною моделлю, інтегрує базові можливості Mythos-класу з новими системами безпеки. Anthropic повідомляє, що запити, пов’язані з високим ризиком (зокрема, кібербезпека, біологія, хімія, дистиляція моделей), автоматично перенаправляються до Claude Opus 4.8 — попередньої флагманської моделі компанії, про що користувачі будуть повідомлені. Більш ніж 95% сесій Fable 5 обробляються без перенаправлення, а понад 1000 годин тестування не виявили універсальних “джейлбрейків”. Fable 5 вже доступна для загального користування через вебсайт, додатки та API. Mythos 5 ж поки що доступна лише користувачам, які мали доступ до Claude Mythos Preview.

Вартість, доступ та впровадження

Anthropic встановила вартість обох моделей: $10 за мільйон вхідних токенів та $50 за мільйон вихідних токенів. Це менше половини вартості Claude Mythos Preview, але все ще вище за ціни багатьох конкурентів.

  • Claude Fable 5 / Claude Mythos 5: $10 (вхідні), $50 (вихідні), $60 (загалом) – Anthropic

Для розробників Fable 5 доступна через Claude API під назвою `claude-fable-5`. Модель інтегрована в API та корпоративні плани з оплатою за використання. Щодо підпискових планів, Fable 5 включена до Pro, Max, Team та Enterprise без додаткової плати до 22 червня. Після цієї дати для її використання знадобляться кредитні бали.

Різниця між Fable 5 та Mythos 5

Fable 5 та Mythos 5 не є моделями різного масштабу, а мають схожі базові можливості. Ключова відмінність полягає в контролі доступу та вбудованих системах безпеки. Fable 5 має шар захисту, який виявляє запити високого ризику та перенаправляє їх до Claude Opus 4.8. Mythos 5 знімає частину цих обмежень для перевірених користувачів у певних сферах. Для більшості завдань Fable 5 працює так само ефективно, як і Mythos 5. Цей підхід дозволяє Anthropic виводити на ринок передові моделі, контролюючи доступ до найризикованіших можливостей.

Значний прогрес у сфері автономного кодування

Для корпоративних клієнтів ключовим застосуванням є розробка програмного забезпечення. Fable 5 може працювати автономно довше та з більшою незалежністю, ніж попередні моделі Claude, що є критично важливим для ШІ-агентів, здатних до ширших завдань, ніж просто автодоповнення коду. На бенчмарку SWE-bench Pro, що вимірює здатність моделей виконувати складні завдання з розробки програмного забезпечення, Fable 5 та Mythos 5 досягли показника 80,3%, значно перевершивши GPT-5.5 від OpenAI (58,6%). На бенчмарку Cognition FrontierCode Diamond, який тестує якість агентивного кодування, моделі показали 29,3% порівняно з 13,4% у Claude Opus 4.8 та 5,7% у GPT-5.5. Anthropic також зазначає, що Fable 5 демонструє кращі результати на FrontierCode навіть при середньому рівні обчислювальних потужностей, що може означати ефективніше кодування без потреби у максимальних ресурсах. Компанія Stripe повідомила про використання Fable 5 для міграції кодової бази Ruby обсягом 50 мільйонів рядків, що зайняло один день замість очікуваних двох місяців роботи команди. Користувачі, такі як Cursor, Replit та Figma, відзначають значні покращення в агентному кодуванні, прототипуванні та створенні додатків. Це свідчить про зрушення у сфері використання ШІ: від генерації окремих фрагментів коду до виконання більших завдань, таких як міграція кодових баз, прототипування додатків, рев’ю запитів на злиття, генерація тестів та налагодження.

Аналітична робота, фінанси, юриспруденція та операційна діяльність

Anthropic позиціонує Fable 5 як потужний інструмент для корпоративної аналітичної роботи. На бенчмарку GDPval-AA Fable 5 та Mythos 5 отримали 1932 бали, тоді як Claude Opus 4.8 — 1890, GPT-5.5 — 1769, а Gemini 3.1 Pro — 1314. На бенчмарку GDPpdf, що фокусується на аналізі візуальних документів, Fable 5 та Mythos 5 показали 29,8% без використання інструментів, випереджаючи Opus 4.8 (22,5%), GPT-5.5 (24,9%) та Gemini 3.1 Pro (16,7%). Це має велике значення для бізнесу, адже значна частина корпоративної роботи пов’язана з різними форматами документів: PDF, електронні таблиці, звіти, контракти. Fable 5 демонструє покращення у роботі з документами, інтерпретації таблиць та вирішенні складних завдань. Компанії Hex та Hebbia відзначають лідерство Fable 5 у складних аналітичних завданнях та на фінансовому бенчмарку, зокрема у роботі з документами, аналізі графіків та розв’язанні проблем. Це свідчить про здатність ШІ переходити від простого узагальнення до вищого рівня аналітичних процесів. Юридичні та операційні команди також можуть отримати значну вигоду. Компанія Crosby Legal зазначає, що Fable 5 у сліпих тестах зрівнюється або перевершує поточну модель у редагуванні документів. Notion використовує Fable 5 для перетворення записів на робочі плани. Zapier відзначає лідерство Fable 5 на AutomationBench, де вона демонструє вищу автономність. Це вказує на потенціал для створення більш ефективних вбудованих ШІ-агентів у корпоративних продуктах, здатних аналізувати контракти, оновлювати плани, складати звіти та виконувати багатоетапні завдання.

Розуміння візуальної інформації та інтерфейсів

Anthropic також заявляє про значні покращення в можливостях обробки зображень у Fable 5. Модель здатна точно витягувати дані з наукових графіків та відновлювати вихідний код веб-додатків лише зі скріншотів. Це має пряме застосування для автоматизації бізнес-процесів, що спираються на візуальні інтерфейси, які не завжди доступні через API: дашборди, PDF, форми, застарілі додатки. Сильніші можливості роботи з зображеннями дозволять ШІ-агентам ефективніше взаємодіяти з такими системами. Anthropic також зазначає, що Fable 5 вимагає менше додаткового налаштування порівняно з попередніми моделями. Як приклад, модель успішно пройшла гру Pokémon FireRed, використовуючи мінімальний інструментарій роботи з зображеннями, що демонструє її здатність до довгострокового планування та виконання завдань у візуальному середовищі. У тестуванні гри Slay the Spire з використанням постійної пам’яті, Fable 5 показала втричі кращі результати, ніж Opus 4.8, що свідчить про її здатність ефективніше використовувати контекстну інформацію під час багатоетапних завдань. Це важливо для внутрішніх агентів, які працюють протягом тривалого часу.

Від обмеженої моделі кібербезпеки до універсального корпоративного ШІ

Запуск відбувся після квітневого випуску Claude Mythos Preview в рамках програми Project Glasswing, призначеної для фахівців з кібербезпеки. Anthropic розробила цю програму після виявлення, що моделі класу Mythos здатні знаходити та використовувати вразливості програмного забезпечення на рівні, що викликає серйозні занепокоєння щодо зловживань. Уряди та розвідувальні агенції розглядають можливості таких моделей для кіберзахисту та наступальних операцій. В той же час, Anthropic стикається з питанням безпечного контролю за можливостями, які вона вважає занадто ризикованими для загального випуску. З Fable 5 Anthropic намагається комерціалізувати можливості класу Mythos, відокремлюючи їх від найризикованіших аспектів. Компанія стверджує, що Fable 5 здатна до розробки програмного забезпечення, досліджень, візуального аналізу, роботи з документами та довгострокових агентних робочих процесів, тоді як класифікатори блокують або перенаправляють запити, що можуть надати переваги зловмисникам. Ці класифікатори охоплюють три основні сфери:

  1. Кібербезпека: виявлення та експлуатація вразливостей, розвідувальні дії, горизонтальне переміщення в мережі.
  2. Біологія та хімія: розробка потенційно небезпечних біологічних речовин.
  3. Дистиляція моделей: спроби вилучення можливостей Claude для навчання конкуруючих моделей.

У випадках виявлення таких категорій, Fable 5 перенаправляє запит до Claude Opus 4.8, повідомляючи про це користувача. Це дозволяє зберегти функціональність, зменшуючи при цьому доступ до найбільш потужної версії моделі. Anthropic стверджує, що системи безпеки пройшли ретельне тестування і не були зламані.

Mythos 5 та обмежений доступ до передових технологій

Mythos 5 призначена для компаній, що працюють у сферах безпеки, критичної інфраструктури та наук про життя. Усі користувачі Claude Mythos Preview можуть оновитися до Mythos 5. Компанія планує розширити доступ через програму довіреного доступу спільно з урядом США. Це важливо для галузей, де заблоковані можливості є основою робочих процесів. Наприклад, команди безпеки можуть потребувати відтворення вразливостей, а дослідники в галузі біології — складних робочих процесів молекулярного дизайну. Mythos 5 демонструє найвищі показники кібербезпеки серед усіх моделей, досягаючи 78,0% на ExploitBench. У сфері біології, моделі класу Mythos перевершують спеціалізовані моделі для роботи з білками. Anthropic стверджує, що Mythos 5 прискорила етапи розробки ліків приблизно в десять разів.

Нові вимоги до зберігання даних

Компанія також запровадила нову політику збереження даних для моделей класу Mythos. Передбачається 30-денне збереження всіх даних для Fable 5, Mythos 5 та майбутніх моделей. Ці дані не будуть використовуватися для навчання нових моделей або в інших цілях, окрім безпеки. Ця політика може стати важливим фактором для підприємств, які потребують передових можливостей ШІ, але водночас вимагають суворого контролю над збереженням даних, особливо в регульованих секторах.

Корпоративні наслідки

Fable 5 демонструє стратегію Anthropic з комерціалізації більш автономних ШІ-моделей, обмежуючи доступ до найпотужніших можливостей. Це може стати шаблоном для випуску нових, більш потужних систем, з різними рівнями доступу та доменами обмежень. Якщо Fable 5 виправдає очікування, розробники зможуть делегувати їй ширші завдання. Для компаній, що працюють з великими обсягами інформації, Fable 5 може стати більш ефективним інструментом у фінансових дослідженнях, аналізі таблиць, юридичному редагуванні та плануванні проєктів. Для команд безпеки це означатиме покращення загального кодування та аналізу, але не повний доступ до можливостей кібербезпеки, які Anthropic вважає ризикованими. Перевірені фахівці з Project Glasswing отримають Mythos 5 для більш прямого використання у виявленні вразливостей. Для компаній у галузі наук про життя Fable 5 може допомогти в загальних дослідженнях, аналізі літератури та наукових міркуваннях, тоді як більш чутливі біологічні можливості залишаться обмеженими. Цей запуск також посилює конкурентний тиск в індустрії ШІ. Anthropic претендує на лідерство у багатьох сферах, але стратегічно важливим є пошук робочого механізму випуску моделей вищого класу. Якщо захисні механізми Fable 5 виявляться надійними, Anthropic зможе швидше виводити потужніші моделі на ринок. Однак, ринок протестує не лише продуктивність Fable 5, а й її надійність, рівень хибних спрацьовувань, компроміси щодо збереження даних та вартість у великих масштабах. Сьогоднішній запуск знаменує чіткий зсув у лінійці Claude. Opus більше не є топовим комерційним рішенням Anthropic. Моделі класу Mythos тепер знаходяться на вищому рівні. Fable 5 — це перший варіант цього рівня для загальних користувачів, а Mythos 5 — обмежена версія для специфічних, високоризикових завдань. Разом вони демонструють, як Anthropic планує інтегрувати передовий ШІ в корпоративні робочі процеси, одночасно обмежуючи доступ до найбільш небезпечних можливостей.

Прогноз ІТ-Блогу: Очікується, що Anthropic продовжить тонке налаштування балансу між можливостями та безпекою, поступово розширюючи доступ до Mythos-класу для нових категорій довірених користувачів. Ймовірно, з’являться більш деталізовані політики щодо використання даних та розроблятимуться нові механізми для зменшення хибних спрацьовувань класифікаторів безпеки.

За даними порталу: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *