Anthropic відкриває доступ до Claude Sonnet 5 зі значною знижкою, готуючись до IPO

Claude Sonnet 5: ШІ-прорив за доступною ціною, що змінює гру для розробників

Компанія Anthropic представила Claude Sonnet 5 – нову модель штучного інтелекту, яка демонструє продуктивність, майже порівнянну з флагманськими рішеннями, але за ціною середнього сегмента. Це стратегічний крок, покликаний надати розробникам корпоративного рівня, чутливим до бюджету, доступ до потужних агентних можливостей саме тоді, коли технологічний гігант готується до виходу на IPO, що стане справжнім випробуванням для вражаючих оцінок ШІ-сектору в приватному капіталі.

Sonnet 5, яку Anthropic описує як “найбільш агентну модель Sonnet на сьогодні”, стає стандартною для користувачів безкоштовних та Pro планів компанії. Вона також доступна для клієнтів Max, Team та Enterprise. Початкова вартість API встановлена на рівні 2 долари за мільйон вхідних токенів та 10 доларів за мільйон вихідних токенів до 31 серпня, після чого ціни зростуть до 3 та 15 доларів відповідно. Це все ще значно нижче за 5 доларів за вхідні та 25 доларів за вихідні токени, які коштує топова модель Opus 4.8.

Стратегічна логіка цього кроку очевидна: Anthropic прагне демократизувати доступ до можливостей, які донедавна були доступні лише в найдорожчих моделях, одночасно стимулюючи широке впровадження серед розробників, що позитивно вплине на документи для IPO (S-1).

Anthropic відкриває доступ до Claude Sonnet 5 зі значною знижкою, готуючись до IPO 1

Результати тестування Sonnet 5: модель середнього класу наближається до флагмана Anthropic

Sonnet 5 демонструє значне покращення порівняно з попередницею, Sonnet 4.6, за всіма показниками, оприлюдненими Anthropic. У тесті SWE-bench Pro, який оцінює кодувальні можливості агентних систем, Sonnet 5 показала результат 63.2% проти 58.1% у Sonnet 4.6. Це наближає її до показника Opus 4.8 – 69.2%. У тесті Terminal-Bench 2.1, ще одному оцінюванні кодування, різниця скорочується: 80.4% для Sonnet 5 проти 67.0% для Sonnet 4.6 та 82.7% для Opus 4.8.

У тестах мультидисциплінарного мислення (Humanity’s Last Exam) Sonnet 5 отримала 43.2% без використання додаткових інструментів та 57.4% з ними. Останній показник практично дорівнює 57.9% у Opus 4.8. У завданнях, пов’язаних з роботою комп’ютера (OSWorld-Verified), Sonnet 5 досягла 81.2%, що є покращенням з 78.5%. А в тесті знань для офісних працівників GDPval-AA v2, вона набрала 1,618 балів, перевищивши показник Opus 4.8 (1,615) та значно обійшовши Sonnet 4.6 (1,395).

Результати цих тестів вказують на послідовну тенденцію: Sonnet 5 не просто покращує попередню версію, а виходить на новий рівень продуктивності, значно перетинаючись із можливостями флагманської моделі Opus, при цьому коштуючи приблизно на 40% менше за стандартними та на 60% менше за початковими цінами за токен.

Корпоративні партнери відзначають: агентні можливості Sonnet 5 завершують завдання, які попередні моделі залишали невиконаними

Акцент на агентних можливостях – здатності планувати, використовувати інструменти, такі як браузери та термінали, а також автономно виконувати багатоетапні робочі процеси – відображає зміну пріоритетів в індустрії штучного інтелекту у 2026 році. Підприємства вже не просто ставлять запитання чат-ботам; вони впроваджують системи ШІ, здатні орієнтуватися у складних програмних середовищах, виконувати багатоетапні завдання з кодування та працювати з мінімальним людським контролем.

Ранні партнери-тестувальники описують модель, яка не просто розпочинає завдання, а й доводить їх до кінця. Суалех Асіф, співзасновник Cursor, редактора коду зі штучним інтелектом, який став барометром впровадження інструментів для розробників, зазначив: “З Claude Sonnet 5 агенти дотримуються плану, відповідають нашим стандартам та вносять чисті багатоетапні зміни, і все це за ефективною ціною”. Деніел Шепард, старший інженер Zapier, розповів, як модель виконала двокомпонентне завдання автоматизації – оновлення рівнів облікових записів у Salesforce та надсилання повідомлення про запуск – яке “раніше зупинялося на півдорозі” з попередніми моделями, але тепер завершується повністю.

Ці свідчення важливі, оскільки вони описують саме той пробіл у надійності, який заважав багатьом підприємствам перевести агентні системи ШІ з пілотних проектів у реальне виробництво. Модель, яка доходить до 80% складного завдання, а потім зупиняється, створює більше проблем, ніж вирішує. Натомість, модель, яка надійно виконує весь робочий процес, змінює економіку автоматизації. Anthropic також представила криві співвідношення вартості та продуктивності, які показують, що розробники тепер можуть регулювати рівні зусиль між Sonnet 5 та Opus 4.8, щоб знайти оптимальний баланс між вартістю та точністю для свого конкретного застосування – це свідчить про зростаючу витонченість у тому, як підприємства використовують послуги ШІ.

Anthropic відкриває доступ до Claude Sonnet 5 зі значною знижкою, готуючись до IPO 2

Оновлений токенізатор покращує продуктивність Sonnet 5, але може непомітно збільшити витрати для деяких завдань

Технічна деталь, прихована в примітках до оголошення, заслуговує на увагу: Sonnet 5 використовує оновлений токенізатор, який змінює спосіб обробки тексту моделлю, подібно до змін, запроваджених Anthropic з Opus 4.7.

Компроміс полягає в тому, що один і той самий вхідний текст може відповідати приблизно 1.0-1.35 раза більшій кількості токенів, залежно від вмісту. Anthropic стверджує, що початкові ціни розраховані так, щоб зробити перехід “приблизно нейтральним за вартістю”, але корпоративні клієнти, які працюють з великими обсягами даних, повинні ретельно протестувати свої конкретні сценарії використання, перш ніж припускати, що їхні рахунки не зміняться.

Anthropic стверджує, що Sonnet 5 безпечніша за попередницю, але найпотужніші моделі все ще лідирують за узгодженістю

Дані безпеки від Anthropic розкривають неоднозначну картину. Компанія повідомляє, що Sonnet 5 демонструє нижчі показники галюцинацій та схильності до “підлабузництва” порівняно з Sonnet 4.6, краще відмовляється виконувати зловмисні запити та є більш стійкою до атак типу prompt injection у контексті агентних систем. У автоматизованому тестуванні поведінки Anthropic (яке перевіряє широкий спектр невідповідних поведінок, включаючи співпрацю зі зловживаннями та обман) Sonnet 5 показала нижчий (тобто безпечніший) загальний результат, ніж Sonnet 4.6.

Однак, Sonnet 5 показала “дещо вищий рівень невідповідної поведінки” порівняно з більш потужною Opus 4.8 та Claude Mythos Preview від Anthropic – останньою є потужна, але суворо обмежена модель компанії, орієнтована на кібербезпеку. У тесті на розробку експлойтів для Firefox 147, створеному у співпраці з Mozilla, жодна з моделей Sonnet не змогла створити робочий експлойт (обидві показали 0.0%), хоча Sonnet 5 продемонструвала дещо вищий рівень часткового успіху (13.2%) порівняно з Sonnet 4.6 (8.8%). Обидві моделі залишаються далеко позаду Opus 4.8 (68.8% робочих експлойтів) та Mythos 5 (88.4%).

Через ці поступові покращення в можливостях, пов’язаних з кібербезпекою, Anthropic впровадила кіберзахист у Sonnet 5 за замовчуванням – системи реального часу, що виявляють та блокують небезпечне використання в галузі кібербезпеки. Ці засоби безпеки аналогічні тим, що використовуються в Opus 4.7 та 4.8, але менш обмежувальні, ніж ті, що застосовуються до Fable 5, останньої моделі класу Mythos, про яку Bloomberg повідомляв 10 червня як про “заборонену для відповідей на запити, пов’язані з кібербезпекою та біологією”. Організації, які беруть участь у програмі Anthropic Cyber Verification Program, автоматично отримують такий самий доступ на Sonnet 5 без необхідності повторного подання заявки.

Anthropic відкриває доступ до Claude Sonnet 5 зі значною знижкою, готуючись до IPO 3

Від 14 до 47 мільярдів доларів доходу: Sonnet 5 виходить на ринок на тлі формування IPO-наративу Anthropic

Запуск Sonnet 5 відбувається, можливо, в найважливіший момент в історії Anthropic. Компанія конфіденційно подала проспект емісії до Комісії з цінних паперів та бірж (SEC) на початку червня, готуючи те, що CNBC описує як “найбільш критично оцінюване публічне розміщення в історії технологій”.

Фінансова траєкторія компанії була надзвичайною. У лютому Anthropic залучила 30 мільярдів доларів при оцінці в 380 мільярдів доларів, повідомивши про річний дохід у 14 мільярдів доларів, який “зростав більше ніж у десять разів за кожен з останніх трьох років”, як передає The Guardian.

До кінця травня Anthropic закрила раунд фінансування Series H на суму 65 мільярдів доларів за пост-грошовою оцінкою 965 мільярдів доларів, спільно з Altimeter Capital, Sequoia Capital та іншими. Річний показник доходу компанії перевищив 47 мільярдів доларів. Харрісон Рольфс, аналітик PitchBook, заявив CNBC, що число, яке “або підтвердить, або зруйнує весь наратив, який приватні ринки враховували протягом трьох років”, буде не оцінка чи дохід, а валова маржа – показник, який досі не бачив жоден зовнішній спостерігач.

У цьому контексті Sonnet 5 слугує подвійній меті. Для розробників вона пропонує реальні покращення можливостей за конкурентними цінами. Для IPO-наративу Anthropic вона демонструє здатність компанії надавати привабливий продукт за ціновим рівнем, який може стимулювати широке впровадження, яке цінує Уолл-стріт – високооб’ємний, регулярний дохід від API від тисяч корпоративних клієнтів.

Державні угоди та зростаюча конкуренція визначають ринок, на який виходить Sonnet 5

Час виходу моделі також збігається з агресивним просуванням Anthropic у сфері інституційних контрактів. Зокрема, губернатор Каліфорнії Гевін Ньюсом оголосив про перше в своєму роді партнерство, що надає доступ до Claude всім державним установам штату зі знижкою 50% та безкоштовним навчанням персоналу.

Кейт Дженсен, керівник відділу Anthropic в Америці, назвала це зусиллям “направити Claude на службу людям, які забезпечують функціонування цього штату”. Угода, яка поширюється на міста та округи Каліфорнії, є саме тим типом довгострокового, регулярного впровадження, яке може стати основою для стабільного доходу, що виходить далеко за межі спільноти розробників.

Однак, випуск Anthropic відбувається на тлі зростаючої конкуренції. OpenAI, яка залучила 122 мільярди доларів у березні за оцінкою 852 мільярди доларів, також прагне вийти на IPO. SpaceX Ілона Маска, що об’єдналася з xAI, встановила ціну свого IPO на рівні 135 доларів за акцію при оцінці 1.77 трильйона доларів. Google, Meta та зростаюча хвиля добре фінансованих конкурентів, включаючи азійські стартапи ШІ, які, як повідомляє The Wall Street Journal, розробляють кібербезпекові можливості, подібні до Mythos, – всі вони борються за той самий корпоративний ринок.

Гіл Лурія, керівник відділу технологічних досліджень D.A. Davidson, зазначив CNBC, що хоча Anthropic “має лідерство” в передових моделях ШІ, “значна частина їх поточного використання припадає на пробні версії та експерименти, і це може не тривати”. Це спостереження стосується головного виклику, з яким стикаються всі передові лабораторії ШІ: перетворення експериментального використання розробниками на стійкий, виробничий дохід.

Anthropic відкриває доступ до Claude Sonnet 5 зі значною знижкою, готуючись до IPO 4

Справжній тест для Sonnet 5 – не бенчмарки, а здатність дешевшого ШІ підтримувати трильйонну історію

Позиціонування Sonnet 5 – пропозиція продуктивності, майже порівнянної з Opus, за цінами Sonnet – це пряма гра на трансформацію. Корпоративні клієнти, які експериментують з дорогими моделями класу Opus, можуть виявити, що Sonnet 5 забезпечує достатню якість для виробничих завдань за ціною, яку фінансові відділи можуть схвалити у великих масштабах. Якщо це спрацює, це може прискорити перехід від експериментів до впровадження, що є необхідним для кожної ШІ-компанії, щоб обґрунтувати свою оцінку.

Три фактори визначать, чи матиме Sonnet 5 значення поза початковими таблицями бенчмарків. Перший – це реальна надійність агентних систем: бенчмарки вимірюють можливості, але виробниче впровадження вимірює послідовність, і справжній тест настане, коли тисячі розробників будуть використовувати модель у складних, непередбачуваних робочих процесах у великому масштабі.

Другий – це економіка токенізатора: оновлений токенізатор із розширенням токенів у 1.0-1.35 рази може непомітно зменшити цінову перевагу для певних завдань, і корпоративні клієнти повинні провести власні аналізи витрат, а не покладатися на основні ціни за токен. Третій – це сам IPO-наратив: коли S-1 Anthropic врешті-решт стане публічним, інвестори ретельно вивчать, чи стимулює рівень Sonnet (дешевший, але високооб’ємний) чи рівень Opus (дорогий, але високомаржинальний) більшу частину доходу і, що найважливіше, валовий прибуток.

Як сказав Рольфс з PitchBook CNBC, вікно IPO 2026 року “або стане найважливішим циклом IPO з часів епохи доткомів, або найдорожчим уроком про співвідношення наративу та фундаментальних показників, який коли-небудь давали публічні ринки”.

Anthropic робить ставку на те, що модель, достатньо потужна, щоб конкурувати з флагманом, і достатньо дешева, щоб працювати у великих масштабах, є продуктом, який заповнить прогалину між цими двома результатами. Публічні ринки незабаром вирішать, чи вони погоджуються.

Прогноз ІТ-Блогу: Модель Sonnet 5, ймовірно, стане потужним каталізатором для компаній, які шукають баланс між продуктивністю ШІ та витратами. Її успіх може стимулювати подальше розшарування ринку ШІ, де спеціалізовані моделі будуть пропонувати оптимальні рішення для конкретних завдань за різними ціновими категоріями.

Джерело новини: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *