Як вашому бізнесу не відставати: Claude пише 80% нового виробничого коду Anthropic

Співзасновник та генеральний директор Anthropic, Даріо Амодеї, передбачав це, але це все одно вражає: більше 80% коду, об’єднаного у виробничій кодовій базі Anthropic у травні, було створено не людьми, а їхньою власною моделлю штучного інтелекту Claude. Про це свідчить новий звіт від провідного стартапу в галузі ШІ.

Ця трансформація призвела до 8-кратного збільшення обсягу коду, що надсилається одним інженером за квартал, порівняно з базовим показником компанії за 2021–2025 роки. Варто зазначити, що це означає ще більше коду, який потребує перегляду — кимось або чимось.

Для керівників технічних відділів підприємств це вже не локальне дослідницьке диво; це новий, агресивний конкурентний стандарт.

Якщо передовий центр дослідження ШІ може успішно делегувати переважну більшість своєї інженерної роботи автономним агентам — демонструючи ознаки довгоочікуваного “рекурсивного самовдосконалення” ШІ, тобто моделей, які можуть самостійно досліджувати та оновлювати себе — що заважає підприємствам інших секторів автоматизувати більше своєї внутрішньої розробки програмного забезпечення за допомогою агентів ШІ?

Звісно, це легше сказати, ніж зробити. Anthropic є одним з ключових творців нинішнього буму генеративного ШІ, тому варто було б очікувати, що вони знають, як ефективно впроваджувати цю технологію.

Але для інших підприємств, які прагнуть збільшити обсяг коду та робочих процесів, що обробляються агентами, новий допис у блозі Anthropic детально описує загальний план, який вони також можуть адаптувати для реінжинірингу своїх операцій та робочих процесів, щоб отримати переваги від останніх досягнень ШІ.

Дорожня карта Anthropic, яку можуть наслідувати інші підприємства

Перехід від людиноцентричного кодування до автономної оркестровки вимагає розуміння еволюції можливостей ШІ. Anthropic окреслює чіткий історичний континуум, який підприємства можуть відобразити на своїх власних дорожніх картах цифрової трансформації:

2021–2023 (Ручне написання): Інженери пишуть код та документацію нативно в локальних текстових редакторах.
2023–2025 (Допомога через чат-ботів): Розробники використовують ранні моделі для генерації коротких фрагментів коду, вручну копіюючи та вставляючи результати у свої середовища.
2025–2026 (Кодувальні агенти): Здатні агенти самостійно пишуть та редагують цілі файли.
Сьогодення (Автономні агенти): Агенти самостійно виконують код, налагоджують живі середовища та делегують багаторічні робочі потоки спеціалізованим під-агентам.

Це швидке вдосконалення підтверджується зовнішніми бенчмарками. Фреймворки оцінки розробки програмного забезпечення, такі як SWE-bench, які ставлять моделям завдання виправлення реальних помилок у складних кодових базах з відкритим вихідним кодом, досягли насичення за дворічний період.

Крім того, оцінки тривалої роботи демонструють, що такі моделі, як Claude Opus 4.6, можуть надійно підтримувати операції протягом 12-годинних завдань, тоді як Claude Mythos Preview перевершує 16 годин безперервного розв’язання проблем.

На внутрішньому рівні технологічний стрибок ще більш разючий. У високоскладних, відкритих інженерних задачах, де спочатку відсутні чіткі специфікації, показник успішності Claude зріс до 76% у травні 2026 року — збільшення на 50 пунктів за шість місяців.

В ізольованих бенчмарках оптимізації, де моделям доручено прискорення коду тренування ШІ-моделей, внутрішня модель Anthropic Mythos Preview досягла прискорення у 52 рази.

Для порівняння, досвідченому розробнику-людині зазвичай потрібно чотири-вісім годин ручного рефакторингу, щоб досягти лише 4-кратного прискорення на тій самій кодовій базі.

3-кроковий план для більш повної автоматизації виробничого коду

Щоб підприємство могло повторити 80-відсотковий показник Anthropic, технічні особи, що приймають рішення, повинні відмовитися від моделі “асистента розробника” та перейти до архітектури “автоматизованої фабрики”. Цей зсув впливає на управління продуктами, операції та робочі процеси розробників у трьох різних напрямках:

1. Перехід від виконання коду до архітектурного нагляду

Коли вартість генерації коду в людський час наближається до нуля, основна роль інженера зміщується від написання програмного забезпечення до визначення цілей та перегляду результатів. Керівники підприємств повинні перенавчати розробників, щоб вони виступали як системні архітектори та судді. Як зазначив один зі співробітників Anthropic щодо операційної реальності цього зсуву:

“Структура речей сьогодні приблизно така: ‘люди мають ідеї, а моделі можуть реалізувати, тестувати та оцінювати їх у [порядок величини] разів швидше, ніж раніше’.”

2. Подолання вузького місця перегляду коду

Введення величезної кількості коду, згенерованого ШІ, в організацію неминуче створює операційні тертя.

Згідно з законом Амдала, прискорення будь-якого процесу суворо обмежене його послідовними, неавтоматизованими вузькими місцями.

В Anthropic масове введення синтетичного коду миттєво перетворило перегляд коду людьми на критичне вузьке місце.

Щоб протидіяти цьому, команди підприємств повинні впровадити автоматизовані інструменти перегляду коду на основі ШІ безпосередньо у свої конвеєри безперервної інтеграції/безперервного розгортання (CI/CD).

Anthropic впровадив автоматизований переглядач Claude (публічно доступна версія, Claude Code Review, була випущена для комерційного використання у березні), завданням якого є аналіз кожного запиту на злиття на наявність архітектурних дефектів, вразливостей безпеки та помилок регресії перед злиттям. Інші спеціалізовані компанії, такі як Qodo, також пропонують інструменти, розроблені спеціально для цієї мети.

У випадку Anthropic, ретроспективні аналізи показали, що автоматизований шар виявив приблизно третину виробничих помилок, які спричинили історичні збої на флагманському веб-сайті claude.ai.

3. Фокус на операційному боргу з високим обсягом

Підприємства часто паралізовані обслуговуванням застарілого коду та давно відкладеним технічним боргом. Замість того, щоб розгортати агентів для написання спекулятивних нових функцій, технічні керівники повинні спрямовувати автономних агентів на операції з ретельного очищення в замкнутому циклі.

У квітні 2026 року інженер Anthropic розгорнув Claude для вирішення стійкого класу помилок API. Працюючи автономно, модель внесла понад 800 індивідуальних виправлень, успішно зменшивши рівень помилок у 1000 разів.

Керуючий інженер оцінив, що розробник-людина витратив би чотири роки на виконання тієї самої роботи через когнітивне навантаження, пов’язане з одночасним утриманням у голові величезного, незнайомого контексту коду.

Міркування для підприємств, що рухаються вперед в епоху переважно згенерованого ШІ коду

Експлуатація кодової бази, переважно створеної ШІ, ставить унікальні виклики управління, з якими повинні впоратися юридичні та служби безпеки підприємств.

На відміну від моделей ліцензування відкритого програмного забезпечення (таких як дозвільна ліцензія MIT або copyleft GPL), корпоративні кодові бази, що використовують пропрієтарну інфраструктуру LLM, залишаються підпорядкованими комерційним умовам обслуговування відповідного постачальника ШІ.

Розгортання автономних агентів вимагає суворих протоколів верифікації для забезпечення відповідності, безпеки та захисту інтелектуальної власності:

Якість та обслуговування коду: Внутрішні дані Anthropic вказують на те, що хоча код, створений ШІ, об’єктивно був нижчої якості, ніж вивід людини наприкінці 2025 року, він досяг приблизної паритетності до середини 2026 року, з очікуваннями перевищити людські стандарти протягом року. Корпоративне управління повинно адаптуватися до реальності, де базова якість автоматизованого виводу структурно перевершує середнє ручне кодування.
Масштабний аудит безпеки: Величезний обсяг автоматизованого створення коду вимагає автоматизованого виявлення вразливостей. Проєкт Glasswing від Anthropic ілюструє масштаби цієї проблеми: використовуючи Mythos Preview, проєкт виявив понад 10 000 програмних вразливостей високого та критичного рівня в глобальній цифровій інфраструктурі протягом перших кількох тижнів. Це повністю змістило виклик корпоративної кібербезпеки з виявлення вразливостей на швидкість впровадження виправлень.
Ризик каскадів узгодженості: Технічні керівники повинні підтримувати суворі ворота верифікації. Якщо підприємство використовує систему ШІ для безперервної модифікації, обслуговування та розширення своєї власної програмної інфраструктури, невиявлені помилки або тонкі невідповідності можуть накопичуватися протягом successive агентських сесій, поступово спотворюючи цілісність системи або вводячи експлойти безпеки, які ухиляються від людського спостереження.

Будьте готові до внутрішніх культурних зрушень на підприємствах

Перехід до кодової бази, що домінує ШІ, змінює культурну динаміку інженерних команд, привносячи як безпрецедентну ефективність, так і глибоке психологічне тертя.

Публічно Anthropic представив ці показники як провісник ширшої трансформації. В офіційній заяві в X компанія зазначила:

“Наші внутрішні дані свідчать, що Claude прискорює розробку ШІ — можливий шлях до рекурсивного самовдосконалення, або ШІ, що самостійно створює більш здібного наступника. Це відбувається швидше, ніж ми думали, і наслідки заслуговують на більшу увагу.”

Незабаром після цього вони розширили інформацію про негайні наслідки для продуктивності:

“Сьогодні інженери Anthropic в середньому випускають у 8 разів більше коду за квартал, ніж у 2021–2025 роках… Багато інженерів також кажуть, що якість коду Claude тепер нарівні з людським кодом; ми очікуємо, що протягом року вона буде кращою.”

За цими корпоративними показниками стоїть складна людська реальність. Внутрішні комунікації співробітників виявляють чітке розмивання традиційної співпраці на робочому місці, оскільки взаємодія розробників між собою систематично замінюється асинхронними викликами агентам:

“Робота (і життя) відбувалися за системою дарів дрібних послуг між людьми. ‘Чи можеш допомогти мені запустити цей скрипт?’ […] кожен з них створював маленький борг, усвідомлення взаємності. Claude поглинув послуги. Це швидше, це не створює жодного боргу, але кожна з цих взаємодій — це втрачена можливість для людської співпраці.”

Для індивідуальних контрибуторів повна автоматизація їхнього основного набору навичок викликає гостру професійну тривогу щодо релевантності та системного контролю:

“Я почав активно використовувати Claudification близько року тому. Це була шалена пригода, і зараз приблизно 5 місяців, як я сам не писав жодного коду.”

“У дні, коли все працює добре, я не можу не думати, що все, що я роблю, не має значення, все автоматизовано і краще та швидше, ніж я коли-небудь зможу. Але потім бувають дні, коли все ламається, і я не розумію чому, і я усвідомлюю, що я вже не знаю, над чим працював.”

Керівники підприємств, які прагнуть відповідати технічній швидкості Anthropic, не можуть ігнорувати цю психологічну динаміку.

Досягнення 80% автоматизованої кодової бази вимагає більше, ніж просто придбання токенів API або налаштування циклів агента; це вимагає повного культурного перегляду, стратегії для пом’якшення тривоги розробників щодо застарівання та впровадження суворих, автоматизованих запобіжників верифікації для збереження остаточного людського контролю над програмним стеком.

Прогноз ІТ-Блогу: Найближчі 1-2 роки стануть свідками значного прогресу у впровадженні автономних агентів ШІ у розробку програмного забезпечення. Ми побачимо появу нових інструментів та платформ, що спрощують інтеграцію цих агентів у існуючі робочі процеси підприємств, одночасно зростаючими інвестиціями в дослідження, спрямовані на підвищення надійності та безпеки коду, згенерованого ШІ.

Джерело новини: venturebeat.com