Anthropic запустила “сновидіння”: ШІ вчиться на власних помилках

Anthropic запустила "сновидіння": ШІ вчиться на власних помилках 1

Як функція «сновидіння» від Anthropic навчає ШІ-агентів вчитися на власному досвіді

У вівторок компанія Anthropic представила оновлення своєї платформи Claude Managed Agents на другій щорічній конференції розробників Code with Claude у Сан-Франциско. Нова функція під назвою «сновидіння» (dreaming) дозволяє ШІ-агентам навчатися на основі власних минулих сесій та вдосконалюватися з часом. Це крок до створення самокоригувальних, самовдосконалюваних систем ШІ, яких вимагають підприємства перед тим, як довірити агентам виробничі завдання. Компанія також перевела дві раніше експериментальні функції — «результати» (outcomes) та «оркестрація мультиагентності» (multi-agent orchestration) — з дослідницької попередньої версії до публічної бета-версії, зробивши їх загальнодоступними для розробників, які працюють на платформі Claude. Разом ці три функції вирішують, за словами Anthropic, найскладніші проблеми масштабування ШІ-агентів: забезпечення їхньої точності, допомога у навчанні та запобігання перетворенню на вузькі місця у складних, багатоетапних робочих процесах. Ранні користувачі вже повідомляють про значні результати. Юридична компанія Wisedocs, що спеціалізується на ШІ, побачила приблизно 6-кратне зростання показників виконання завдань після впровадження «сновидіння». Компанія Wisedocs, що займається аналізом медичних документів, скоротила час обробки документів на 50%, використовуючи функцію «результати». А Netflix наразі обробляє журнали сотень збірок одночасно, використовуючи оркестрацію мультиагентності. Ці оголошення з’являються на тлі надзвичайного імпульсу для Anthropic. Генеральний директор Даріо Амодеї під час відкритої бесіди на конференції повідомив, що зростання компанії перевищило навіть найсміливіші внутрішні прогнози. У першому кварталі 2026 року Anthropic зафіксувала, за словами Амодеї, 80-кратне щорічне зростання доходів та використання, що значно перевищує запланований 10-кратний річний ріст. Обсяг API на платформі Claude зріс майже в 70 разів рік до року, а середній розробник, який використовує Claude Code, зараз витрачає 20 годин на тиждень, працюючи з цим інструментом. «Ми намагалися ретельно планувати світ із 10-кратним зростанням на рік», — сказав Амодеї. «І все ж ми побачили 80-кратне зростання. Саме тому ми мали труднощі з обчислювальними потужностями».

Anthropic запустила "сновидіння": ШІ вчиться на власних помилках 2

Як функція «сновидіння» від Anthropic навчає ШІ-агентів вчитися на власному досвіді

«Сновидіння» — це найновіша з трьох функцій, і Anthropic прагне відрізнити її від традиційних систем пам’яті. Хоча компанія випустила пам’ять для агентів раніше цього року, що дозволяє Claude зберігати вподобання та контекст під час і між окремими сесіями, «сновидіння» працює на вищому рівні абстракції. Це запланований процес, який переглядає минулі сесії та сховища пам’яті агента, витягує закономірності з них та каталогізує ці спогади, щоб агенти вдосконалювалися з часом. Він виявляє інсайти, які не може побачити жодна окрема сесія агента: повторювані помилки, робочі процеси, до яких агенти приходять незалежно, та вподобання, спільні для команди агентів. Алекс Альберт, керівник відділу управління дослідницькими продуктами в Anthropic, пояснив цю концепцію на конференції. Він описав «сновидіння» як аналогію до того, як люди в організаціях створюють навички після виконання завдання. «Вони можуть виконати робочий процес з Claude, і в кінці цього процесу, після того, як вони пройшли кілька ітерацій та зигзагів, вони хочуть зафіксувати цей шлях від А до Б», — сказав Альберт. «Дуже схожа річ відбувається зі «снами» — замість того, щоб ви вручну створювали навичку на основі свого досвіду роботи з Claude, модель робить це, тому вона має той самий контекст для майбутньої сесії». Важливо, що «сновидіння» не змінює базові ваги моделі. «Ми не змінюємо саму модель через «сновидіння» — це не оновлення ваг або щось подібне», — сказав Альберт. Натомість агент записує уроки у вигляді простих текстових нотаток та структурованих «плейбуків», які майбутні сесії можуть використовувати як довідник, роблячи весь процес спостережуваним та доступним для аудиту людьми. Відповідаючи на запитання про довіру до агентів, які консолідують власні знання, Альберт визнав, що «існує певний рівень довіри, який ви повинні надати», але зазначив, що всі спогади можна перевіряти, і більш розвинені моделі стають все кращими в управлінні цим процесом. «Вони вчаться писати кращі нотатки для свого майбутнього «я», — сказав він.

Жива демонстрація показала, як ШІ-агенти вдосконалюються за ніч без людського втручання

Під час ключової доповіді команда Anthropic продемонструвала всі три функції в прямому ефірі, використовуючи вигаданий стартап у аерокосмічній галузі під назвою «Lumara», якому потрібно було автономно посадити дрони на Місяці для видобутку ресурсів. Команда налаштувала мультиагентну систему з трьома спеціалістами — агент-командир, відповідальний за загальний успіх місії; агент-детектор, який визначав якісні місця посадки; та агент-навігатор, який керував безпечним польотом дрона та посадкою — і визначила критерії успіху, що вимагали м’яких посадок, чистої поверхні та достатнього запасу палива для повернення на Землю. Початкове моделювання на шести гіпотетичних місцях посадки дало сильні, але не ідеальні результати. Для покращення доповідачі ініціювали сесію «сновидіння» безпосередньо з Claude Developer Console. За ніч агент «сновидіння» переглянув усі минулі симуляційні сесії та написав детальний «десантний плейбук» — комплексний набір евристик, витягнутих із закономірностей, виявлених у багатьох місіях. Коли наступного ранку команда запустила нову симуляцію з «десантним плейбуком», отриманим завдяки «снам», результати значно покращилися на тих ділянках, які раніше показували слабкі результати. «Все, що нам потрібно було зробити, це просто натиснути кнопку, яку натиснула Кейтлін», — сказала Анджела Цзян, керівник відділу продуктів Claude Platform, посилаючись на свою колегу на сцені. «Все завдяки «снам». Демонстрація проілюструвала, як ці три функції взаємодіють на практиці. Оркестрація мультиагентності розподілила складне завдання між спеціалістами з незалежними контекстними вікнами. «Результати» надали критерії, за якими окремий агент-оцінювач оцінював кожну ітерацію. А «сновидіння» витягувало уроки з цих ітерацій для покращення майбутньої продуктивності, формуючи те, що Anthropic описує як безперервний цикл вдосконалення, який не вимагає людського втручання між ітераціями.

Чому Anthropic створила окремий агент-«оцінювач» для перевірки власної роботи Claude

Функція «результати», яка зараз перебуває у публічній бета-версії, надає розробникам можливість визначати, що є успіхом, за допомогою системи критеріїв — структурної рамки, стандарту презентації, брендового голосу або будь-якого іншого набору критеріїв. Потім агент автономно ітерує до цього стандарту. Що робить «результати» архітектурно відмінними, так це їхнє розділення відповідальності. Коли агент завершує роботу, окремий агент-оцінювач оцінює результат на основі визначених розробником критеріїв у власному незалежному контекстному вікні. Оскільки оцінювач працює в новому контексті, він не зазнає впливу міркувань робочого агента чи накопичених упереджень сесії. Коли оцінювач виявляє розбіжності між результатом та критеріями, він точно вказує, що потрібно змінити, і робочий агент робить наступний прохід. Цей цикл триває доти, доки критерії не будуть задоволені — без необхідності людського перегляду кожної спроби. Альберт описав ширшу стратегію верифікації Anthropic як використання «більше обчислювального часу для тестування, більше моделей, що довше думають над проблемою, щоб перевірити роботу іншої». Він визнав, що коли модель перевіряє власну роботу, це викликає слушні запитання, але сказав, що новий контекст, який переглядає завершену роботу, стабільно перевершує запит тієї ж тривалої нитки на ідентифікацію власних помилок. «Ви отримаєте вищий успіх, якщо надасте цей результат свіжому Claude і скажете: «Які помилки ви бачите?»», — сказав він. «Все ще є щось щодо уваги», яка деградує протягом дуже тривалих сесій — обмеження, над яким Anthropic активно працює у майбутніх моделях. Цей підхід відображає стратегії, які вже використовуються на GitHub. Маріо Родрігес, головний директор з продуктів GitHub, під час окремої доповіді на конференції описав, як Copilot використовує подібну модель радника з моделями Claude — поєднуючи меншу, дешевшу модель як виконавця з більшою моделлю як наставником. Коли менша модель стикається з проблемою, що перевищує її можливості, вона звертається до більшої моделі за порадою, а потім продовжує виконання самостійно. Родрігес зазначив, що такий підхід забезпечує інтелект, майже на рівні Opus, при значно нижчій вартості, і що GitHub вставляє моделі критики на трьох конкретних етапах робочого процесу кодування: після розробки плану, після складної реалізації та після написання тестів, але перед їх запуском.

Паралельні ШІ-агенти тепер можуть вирішувати завдання, надто складні для одного потоку моделі

Оркестрація мультиагентності, третя функція, що переходить до публічної бета-версії, дозволяє провідному агенту розбивати велике завдання на підзавдання та делегувати кожне з них агенту-спеціалісту — кожен зі своєю власною моделлю, системним запитом, інструментами та незалежним контекстним вікном. Кожен крок процесу відстежується в Claude Console, показуючи, який агент що зробив, у якому порядку та чому. Ця конструкція надає кожному під-агенту ізольований контекст, що, за словами Anthropic, призводить до кращих результатів, ніж коли один агент намагається утримати всю складність в одному потоці. «Кожен під-агент має власний незалежний потік та контекстне вікно», — пояснили доповідачі. «Це дуже навмисно — ми виявили, що, розділяючи роботу, а потім об’єднуючи результати, ми отримуємо кращі результати». Альберт запропонував свою власну евристику щодо того, коли паралельні архітектури агентів мають сенс порівняно з використанням одного потоку. «Паралельні агенти кращі для розслідування», — сказав він — ситуацій, де є багато контексту, який врешті-решт буде відкинуто. «Якщо ви намагаєтеся відповісти на конкретне запитання, вам не потрібні всі результати пошуку з областей, де відповіді не знайдено. Вам просто потрібна відповідь». Він описав створення одноразових під-агентів для конкретних завдань пошуку та повернення лише результату до основного потоку. За його словами, все частіше сама модель буде вирішувати, коли паралелізувати. «У майбутньому ви насправді не будете піклуватися про те, чи це один агент, чи мультиагент, чи щось інше відбувається. У вас просто буде Claude, з яким ви розмовляєте, і він автоматично розгорне правильну архітектуру».

Більша ставка Anthropic: скорочення розриву між можливостями ШІ та реальним впровадженням

Ці три функції з’являються як частина ширшого просування платформи, яке Anthropic позиціонувала протягом конференції як скорочення «розриву між тим, що може робити ШІ, і тим, що він насправді робить для людей». Емі Вора, директор з продуктів Anthropic, визначила тему своєї вступної доповіді, зазначивши, що хоча можливості моделей зростають експоненціально, більшість організацій все ще впроваджують ШІ лінійно. Діана Пенн, керівник відділу продуктів дослідницької команди Anthropic, описала міру прогресу компанії як «горизонт завдань» — як довго ШІ-агент може працювати автономно, покращуючи якість своїх результатів. «Минулого року моделі могли працювати хвилинами», — сказала вона. «Зараз більшість з нас має агентів, які працюють годинами. Завтра ми матимемо агентів, які будуть проактивними, завжди ввімкненими та знатимуть, над чим працювати, не втрачаючи контексту». На заході також було представлено кілька інфраструктурних оголошень, спрямованих на допомогу розробникам не відставати. Anthropic заявила, що подвоює свої п’ятигодинні ліміти швидкості для планів Pro, Max, Team та Enterprise, а також значно підвищує ліміти швидкості API. Компанія оголосила про партнерство з SpaceX для використання повної потужності свого центру даних Colossus для розширення доступності обчислювальних потужностей — пряма відповідь на дефіцит попиту, про який говорив Амодеї. Усі три функції вбудовані в Claude Managed Agents, які були запущені в публічній бета-версії 8 квітня як стандартизований інструмент, що об’єднує найкращі практики, включаючи пам’ять, інтеграцію інструментів та обробку дій. Anthropic стверджує, що команди, які використовують Managed Agents, випустили продукти в 10 разів швидше, ніж ті, хто створює власну агентську інфраструктуру з нуля. Альберт описав платформу, використовуючи аналогію з операційною системою: «З керованими агентами вам не потрібно думати про всі технічні деталі налаштування навколишньої системи», — сказав він. «Ви створюєте додаток для Mac — ви ж не хочете переробляти кожну деталь macOS».

Що «сновидіння», «результати» та «оркестрація мультиагентності» означають для майбутнього корпоративного ШІ

Конкурентні наслідки є значними. Поки платформи ШІ від OpenAI, Google та інших змагаються за залучення розробників, Anthropic робить ставку на те, що надійність у виробництві, а не лише сирий інтелект моделі, визначатиме, яка платформа виграє корпоративні бюджети. Зокрема, функція «сновидіння» відкриває нову територію: хоча інші платформи пропонують пам’ять та використання інструментів, ідея систематичного перегляду агентами власної історії для вилучення повторно використовуваних знань йде далі до систем безперервного вдосконалення, які потрібні підприємствам перед делегуванням високоризикованої роботи. Конференція продемонструвала компанії, які вже працюють у такому масштабі. Mercado Libre, найбільша платформа електронної комерції Латинської Америки, має 23 000 інженерів, які використовують Claude Code, переглянула понад 500 000 запитів на злиття з людським наглядом і прагне до 90% автономного кодування до третього кварталу цього року. Shopify розгорнула Claude Code не лише в інженерних командах, але й у командах дизайну, продуктів та науки про дані. Але саме Даріо Амодеї висловив найширше бачення того, до чого це все призведе. Він описав прогресію від одного агента до множинних агентів, до цілісної організаційної розвідки — від «команди розумних людей у кімнаті» до того, що він назвав «країною геніїв у дата-центрі». І він підтвердив прогноз, зроблений приблизно рік тому: що 2026 рік побачить першу компанію з мільярдом доларів, керовану однією особою. «Поки що цього не сталося», — сказав він. «Але у нас залишилося сім місяців». «Сновидіння» зараз доступне в дослідницькій попередній версії. «Результати» та «оркестрація мультиагентності» перебувають у публічній бета-версії та доступні всім розробникам на платформі Claude. Чи буде достатньо семи місяців для соло-засновника, щоб побудувати бізнес вартістю мільярд доларів, залишається відкритим питанням — але після вівторка у них з’явилося ще кілька інструментів для використання.

Прогноз ІТ-Блогу: Функція «сновидіння» суттєво змінить ландшафт ШІ-агентів, перетворюючи їх з інструментів для виконання окремих завдань на самодостатні, еволюціонуючі системи. Це пришвидшить розробку ШІ-рішень для підприємств, дозволяючи їм впроваджувати складніші та надійніші автоматизовані процеси.

Дізнатися більше на: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *