Resolve AI виправляє збої в системах виробництва, спричинені бумом ШІ-кодування

Resolve AI, стартап у сфері виробничих операцій, підтриманий Greylock та Lightspeed Venture Partners, оголосив про масштабне розширення своєї платформи. Нововведення включають постійно активні фонові агенти, модернізовану архітектуру для розслідувань та спільний робочий простір, де інженери та ШІ-агенти взаємодіють у реальному часі під час усунення критичних збоїв.

Центральним елементом оновлення є нова система розслідувань на базі мультиагентності, розроблена власним дослідницьким центром Resolve AI. Замість розгортання одного ШІ-агента для діагностики виробничої помилки, що аналогічно роботі інженера на чергуванні, платформа тепер залучає скоординовану команду спеціалізованих агентів. Вони одночасно досліджують численні гіпотези, незалежно перевіряють висновки один одного та будують повні причинно-наслідкові ланцюжки від першопричини до прояву. Компанія стверджує, що ця архітектура забезпечує більш ніж дворазове покращення точності визначення першопричини на внутрішніх тестових наборах порівняно з попередніми версіями платформи.

«Уявіть, що один агент чергує, як людина», — зазначив генеральний директор та співзасновник Resolve AI Спірос Ксантос в ексклюзивному інтерв’ю VentureBeat напередодні анонсу. «Тепер у нас є команда агентів, які працюють разом, майже як команда людей, що виявляють проблему. Це покращило якість удвічі».

Ця новина з’являється в період гострої напруги в індустрії програмного забезпечення. Генерація коду за допомогою ШІ набула стрімкої популярності, дозволяючи інженерним командам випускати значно більше програмного забезпечення, ніж два роки тому. Однак забезпечення стабільної роботи цього програмного забезпечення у продакшені — налагодження, моніторинг після розгортання, аудит його стану — залишається переважно ручним процесом. Для компанії, яка на початку року залучила 125 мільйонів доларів у рамках раунду Серії А з оцінкою в 1 мільярд доларів, Resolve AI робить пряму ставку на те, що операційна сторона життєвого циклу програмного забезпечення є наступним великим рубежем для інвестицій у сферу ШІ.

Що сотні реальних тестових випадків розкривають про заявлену точність

Будь-яка заявка про точність від стартапу заслуговує на критичний аналіз, і Ксантос був відвертим як щодо масштабів, так і обмежень оцінки. Показник «2x» походить з внутрішніх тестів, а не від незалежного аудиту, хоча набір оцінок був побудований таким чином, щоб відображати складність, з якою щодня стикаються корпоративні клієнти Resolve AI.

«Це дуже складні оцінки, які ми розробляли протягом тривалого часу, щоб представити реальні приклади», — пояснив Ксантос. «Це не дані клієнтів, але ці оцінки відображають складні випадки, подібні до тих, що ми бачили у найбільших технологічних компаніях, з якими співпрацюємо». Він описав набір як такий, що містить сотні випадків, які відображають типи виробничих збоїв, що трапляються в таких компаніях, як Coinbase, Salesforce, DoorDash та Zscaler — усі вони є клієнтами Resolve AI.

Практичний вплив такого підвищення точності є значним. Агенти Resolve AI тепер діють як перші реагуючі на кожен сигнал тривоги, зазвичай проводячи попередню діагностику протягом п’яти хвилин ще до того, як людина-інженер втрутиться. У попередніх публічних звітах компанія зазначала, що DoorDash скоротив час до визначення першопричини до 87 відсотків. Відповідаючи на запитання про контекст цієї цифри, Ксантос описав типовий базовий рівень.

«Коли щось йде не так, людині може знадобитися від п’яти до 10 хвилин, щоб просто взяти свій ноутбук і підключитися», — сказав він. «Типовий MTTR (середній час до усунення) становить десятки хвилин, іноді години, залежно від серйозності. Тому покращення на 80+ відсотків — у чотири-п’ять разів швидше — це насправді величезно. Це те, чого ми ніколи раніше не досягали за допомогою ШІ, інструментів, даних чи спостережливості».

Як ШІ-агенти перевіряють один одного, щоб запобігти галюцинаціям першопричин

Однією з основних проблем застосування великих мовних моделей у критично важливих виробничих середовищах є їхня схильність генерувати правдоподібні, але неправильні відповіді — збій, який у контексті активного збою може змусити інженерну команду переслідувати хибне рішення, поки послуга залишається недоступною.

Ксантос прямо визнав це. «Це дуже поширена проблема з моделями «з коробки», — сказав він. «Вони завжди намагаються дати вам відповідь, і якщо у них недостатньо доказів, вони дадуть вам найкращу можливу відповідь — яка, ймовірно, буде неправильною».

Заходом протидії Resolve AI є система багатошарової верифікації між агентами. Кожен агент, що досліджує гіпотезу, повинен посилатися на кожний доказ, на який він спирається, і представити цей доказ іншому агенту для незалежного перегляду. Агент, який проводить розслідування, повинен побудувати повний причинно-наслідковий ланцюжок — від першопричини до прояву — а агенти-рецензенти активно намагаються спростувати теорію, виявляючи прогалини в логіці.

«Часто агенти фактично спростовують ці теорії, бо знаходять прогалини», — сказав Ксантос. «Існує багато рівнів захисту та агентських перевірок, які дозволяють Resolve бути дуже точним і не вводити в оману».

Однаково важливим, за його словами, є готовність системи визнати незнання. «Планка для фактичного твердження «У мене є відповідь» дуже висока. У таких випадках вона скаже: «Ось докази, які я знайшов. Ось три або чотири шляхи, якими ви можете піти звідси, але мені не вдалося повністю довести, що це проблема». Система, яка працює у продакшені, не може бути «чорною скринькою». У доменах, де помилкові відповіді мають операційні наслідки, відкалібрована невизначеність може бути ціннішою за впевнені вихідні дані. Для ШІ-системи, інтегрованої в процес реагування на інциденти, впевнене спрямування інженерів у неправильному напрямку під час збою, що впливає на клієнтів, може посилити ту саму шкоду, яку вона мала запобігти.

Як нові фонові агенти, що ніколи не виходять з чергування

Окрім реагування на інциденти, Resolve AI впроваджує новий клас фонових агентів, призначених для виконання безперервної, часто невидимої операційної роботи, яку інженерні команди повинні виконувати, але яку важко підтримувати у великих масштабах.

Ці агенти працюють за розкладом або автоматично активуються у відповідь на події — нове розгортання, спрацювання сигналу тривоги, злиття запиту на злиття (pull request) — і накопичують інституційні знання з кожного розслідування та взаємодії з людиною з часом. Коли інженер відкриває інтерфейс Resolve AI, агенти вже працюють: попередньо досліджують пріоритетні проблеми, відстежують розгортання, аудитують якість сповіщень, позначають розбіжності в конфігурації та виявляють аномалії витрат.

Ксантос провів розмежування між фоновими агентами та агентами реагування на інциденти, які були основним продуктом Resolve AI. «Тепер ці агенти можуть працювати у фоновому режимі постійно — не тільки тоді, коли людина просить агента усунути проблему або коли спрацьовує сповіщення», — сказав він. «Багато наших клієнтів зараз відстежують зміни, які потрапляють у продакшен, ще до того, як вони спричинять проблему. Існує агент, який постійно відстежує це».

Він описав цих фонових агентів як «універсальних SRE-агентів, доступних кожному розробнику», здатних виконувати завдання, що варіюються від моніторингу змін в інфраструктурі, які можуть збільшити хмарні витрати, до виконання робіт з аналізу після інцидентів, таких як генерація виправлень коду на основі висновків з інциденту. Ця концепція вирішує структурну проблему в операціях програмного забезпечення: щоденні завдання, необхідні для підтримки здорової роботи виробничих систем — моніторинг розгортань, дослідження сповіщень, відстеження змін у складних середовищах — є критично важливими, але реактивними та ручними. Інженерні організації знають, що ця робота має бути виконана, але вона конкурує за увагу з розробкою нових функцій. Автоматизовані агенти, які постійно виконують цю роботу, можуть допомогти командам перейти від реактивного гасіння пожеж до проактивного операційного менеджменту.

Спільний робочий простір, де інженери та ШІ-агенти досліджують разом

Третій основний компонент релізу — це те, що компанія називає спільною поверхнею для розслідувань — робочий простір, де інженери та ШІ-агенти працюють з одними й тими ж живими даними під час активного інциденту. Звіти динамічно оновлюються відповідно до розвитку розслідувань. Кожне знахідка може бути перевірена. Інженери можуть досліджувати побічні гіпотези, не перериваючи основного робочого процесу. Запити до джерел можуть бути витягнуті та модифіковані на місці, докази вбудовані безпосередньо в робочий простір, а дії з виправлення можуть бути запущені з того самого інтерфейсу без перемикання між інструментами.

«Розглядайте це як інтерфейс до всіх виробничих інструментів, але також як інтерфейс, де люди та агенти можуть співпрацювати один з одним — або агенти з агентами», — сказав Ксантос. «Це те, що поступово призводить до більшої довіри та більшої автоматизації, тому що ви працюєте з агентом, навчаєте його, бачите результати».

Компанія також надає доступ до своєї платформи через REST API та MCP (Model Context Protocol) сервер, що дозволяє інженерним командам інтегрувати Resolve AI у ширші агентські робочі процеси та інфраструктуру. За словами Ксантоса, це вже відбувається на практиці. «Універсальний агент, створений компанією — коли справа доходить до налагодження, цей агент може викликати Resolve», — сказав він. «Або хтось працює зі своїм кодувальним агентом на ноутбуці, і Resolve з’являється там як MCP. Якщо є якась діяльність, пов’язана з продакшеном, кодувальний агент може її викликати». Стратегія взаємодії свідчить про те, що Resolve AI розглядає себе не як замкнуту систему, а як спеціалізований вузол у ширшій екосистемі ШІ-агентів, які все частіше будуть передавати завдання один одному — шаблон, який Ксантос порівняв з відкритою архітектурою Інтернету, а не з моделлю «саду із замком» зі свого магазину додатків.

Чому Resolve AI стверджує, що може перевершити Datadog, PagerDuty та хмарних гігантів

Простір агентних операцій став конкурентним за останній рік. Datadog, PagerDuty та великі хмарні провайдери анонсували можливості операцій, доповнені ШІ. На запитання, що відрізняє Resolve AI від цих конкурентів, Ксантос вказав на глибину технічної основи компанії.

«Ми працюємо на передовій. Немає жодного плану, як будувати таку систему, як Resolve», — сказав він. Він зазначив, що вони з співзасновником Маянком Агарвалом спільно створили OpenTelemetry, найпоширеніший проект з відкритим кодом у сфері спостережливості, який зараз є де-факто стандартом для збору метрик, журналів та трасувань із сучасних програмних систем.

Ксантос також відзначив нещодавно створену AI Lab компанії, яку очолює дослідник, що, за його словами, раніше був керівником напрямку пост-тренування моделей Llama від Meta. «Йому вдалося поєднати глибоку експертизу у виробничій спостережливості з ШІ та моделями, і я думаю, що це дуже унікально», — сказав Ксантос. «Я не вірю, що будь-яка інша компанія, чи то з досвідом у сфері спостережливості, чи то стартап, має все це разом».

Структурні переваги компанії, за словами Ксантоса, включають повну модель середовища, яку Resolve створює для кожного клієнта, систему пам’яті, яка навчається в конкретному виробничому середовищі клієнта, та його мультиагентну архітектуру. Лабораторія наразі тренує передові моделі на виробничих даних — такого роду процедурних знань, які досвідчені інженери використовують для налагодження виробничих проблем, але які не з’являються в стандартних наборах тренувальних даних. Цей підхід відображає зростаючу закономірність серед компаній, що розробляють ШІ-додатки: використання передових базових моделей як основи, але з великими інвестиціями в доменно-специфічне доналаштування, пошук та архітектури агентів для досягнення рівня точності, якого загальні моделі не можуть досягти самостійно.

Як ціноутворення, засноване на результатах, змінює економіку ШІ у продакшені

Модель ціноутворення Resolve AI відрізняється від традиційного ліцензування корпоративного програмного забезпечення. Компанія продає кредити, які споживаються, коли агенти виконують роботу — підхід, заснований на результатах, який безпосередньо пов’язує витрати з наданою цінністю.

«Ми не продаємо програмне забезпечення», — сказав Ксантос. «Спосіб купівлі та використання Resolve полягає в придбанні кредитів, які споживаються, коли Resolve виконує дію. Це засновано на результатах. Лише тоді, коли Resolve усуває проблему з попередженням — це єдиний час, коли воно споживає кредити».

Він прямо відповів на питання про вартість, стверджуючи, що Resolve AI насправді дешевше, ніж альтернатива побудови подібної системи з нуля за допомогою передових моделей та MCP-інтеграцій. «Якби ви взяли Opus або GPT-5.4 і спробували побудувати рішення, подібне до Resolve, з MCP, ми виміряли — ви насправді споживаєте набагато більше токенів, ніж доведеться платити Resolve, тому що наша система дуже оптимізована з точки зору контексту, з точки зору того, як вона читає часові ряди даних».

Щодо постійно активних фонових агентів, Ксантос зазначив, що їхня безперервна робота не обов’язково збільшує витрати. «Фоновий агент не означає, що він постійно виконує інтенсивну роботу. Це означає, що він може бути там; ви можете дати йому будь-яке завдання. Багато з цих завдань запускаються на основі певної дії — спрацьовує сповіщення, хтось зливає PR, і ви хочете побачити, чи це впливає на продакшен».

Для корпоративних клієнтів у регульованих галузях — таких як Coinbase та Zscaler — безпека даних та їхнє зберігання є невід’ємними. Resolve AI враховує це завдяки гнучкій моделі розгортання: площина даних розміщується там, де вже знаходяться існуючі інструменти клієнта, тоді як шар інференсу може працювати як стандартний SaaS-розгортання або всередині VPC клієнта. «Ми розробили Resolve для роботи з великими підприємствами, де стандарти безпеки найвищі», — сказав Ксантос. «Існує багато заходів, які ми вживаємо для забезпечення безпеки Resolve, включаючи незбереження даних».

Чому керівники інженерних відділів повільно вчаться довіряти ШІ-агентам виробничі системи

Питання про те, чи довірятимуть інженерні команди ШІ-агентам автономно діяти у продакшені — відкочувати розгортання, додавати потужності, генерувати запити на злиття — є одним із визначальних культурних викликів цієї хвилі технологій. Ксантос провів аналогію з автономними транспортними засобами.

«Щоб дозволити автомобілю самостійно їздити по дорозі, ми повинні довести, що він безпечніший за людину. Агенти у продакшені — це дуже схожа концепція», — сказав він. Він визнав, що не всі клієнти комфортно ставляться до того, щоб агенти брали на себе автоматизовані дії, але описав градієнт довіри, який, на його думку, швидко еволюціонуватиме.

«Існує набір дій, які відносно безпечні, які більшість технологічних компаній, ймовірно, готові дозволити агенту виконати, і, ймовірно, є інший набір дій, для яких людина повинна дати дозвіл», — сказав він. «Але з огляду на постійне зростання якості, яке ми бачимо в Resolve, я б сказав, що цього року ми подолаємо поріг, коли більшість дій будуть виконуватися агентом автоматично».

Він описав типову траєкторію впровадження: компанії починають з того, що агенти надають рекомендації, потім людина вирішує, натискати кнопку чи ні. Протягом тижнів або місяців довіра зростає поступово. «Я не думаю, що це проблема, коли ми просто дозволяємо агентам діяти безконтрольно з самого початку», — сказав Ксантос. Такий поетапний підхід відображає те, як завжди відбувалося впровадження корпоративних технологій — від хмарної міграції до оркестрації контейнерів, організації рухаються зі швидкістю довіри, а не зі швидкістю можливостей.

Аргумент, що код, згенерований ШІ, погіршує кризу продакшену, а не покращує її

Можливо, найпровокаційнішим аргументом у тезі Resolve AI є те, що вибух коду, згенерованого ШІ, насправді посилює проблему виробничих операцій. У нещодавньому пості в LinkedIn Ксантос виклав цю динаміку в різких термінах, стверджуючи, що керівники інженерних відділів, які святкують швидше випуск коду, не інвестуючи в виробничі операції, фактично змушують своїх старших інженерів «субсидувати швидкість» через збільшення навантаження з реагування на інциденти.

У своєму інтерв’ю з VentureBeat він повернувся до цієї теми. «Тепер, коли кодувальні агенти генерують код, ми виробляємо значно більше коду, з яким ми менш знайомі — люди менш знайомі — тому нам потрібен ШІ як захист», — сказав він.

Таке позиціонування представляє Resolve AI не просто як інструмент продуктивності, а як необхідний противагу революції у створенні коду за допомогою ШІ. Оскільки організації впроваджують більше коду, написаного інструментами, які їхні інженери можуть не до кінця розуміти, що працює на виробничих системах, які ці інженери не створювали, аргумент полягає в тому, що операційна складність — і наслідки збоїв — пропорційно зростатимуть. У подкасті Stack Overflow минулого жовтня Ксантос надав цифри цьому твердженню, оцінивши, що інженери витрачають понад 70 відсотків свого часу на підтримку та налагодження виробничих систем, а не на розробку нових функцій. «Ми стикаємося з новою кризою, де ми будуємо швидше, ніж можемо оперувати», — сказав він у цій розмові.

Resolve AI було засновано на початку 2024 року Ксантосом та Агарвалом, які вперше зустрілися під час навчання на докторських програмах в Університеті Іллінойсу та працювали разом понад десятиліття. Ксантос раніше був співзасновником Pattern Insight (придбано VMware) та Omnition (придбано Splunk), де пара допомогла створити OpenTelemetry. Компанія залучила 35 мільйонів доларів посівного фінансування від Greylock у 2024 році, за якими послідувала Серія А на 125 мільйонів доларів під керівництвом Lightspeed з оцінкою в 1 мільярд доларів на початку цього року. Серед названих клієнтів — Coinbase, DoorDash, MSCI, Salesforce, MongoDB та Zscaler.

Довгострокове бачення Ксантоса є широким. «У довгостроковій перспективі, коли можливості агентів перевищать можливості інженера-програміста, кінцевим результатом буде набагато більше технологій і набагато більше програмного забезпечення», — сказав він. «Насправді це не означає менше людей, що працюють над цим. Це означає, що технології стають дешевшими, доступнішими, виробляючи значно більше технологій на благо світу».

Реалізація цього бачення займе роки. Але більш безпосередня обіцянка сьогоднішнього анонсу зводиться до того, що інтуїтивно зрозуміло кожному інженеру на чергуванні: дзвінок о 2 годині ночі, поспіх до ноутбука, шалена пошук по панелях моніторингу та логах для відповіді, яка може зайняти хвилини або години. Resolve AI робить ставку на те, що наступного разу, коли спрацює цей сигнал, команда агентів вже проведе розслідування, перевірку та документацію першопричини ще до того, як телефон інженера засяє.

Прогноз ІТ-Блогу: Розвиток мультиагентних систем у Resolve AI, ймовірно, стимулюватиме нові підходи до автоматизованого усунення несправностей, де спеціалізовані агенти зможуть спільно вирішувати дедалі складніші виробничі проблеми. Очікується, що ця тенденція призведе до подальшого зниження середнього часу до усунення (MTTR) та підвищення надійності систем, водночас ставлячи нові виклики перед інженерами у сфері нагляду та управління цими складними ШІ-системами.

За матеріалами: venturebeat.com