Sakana AI створює “надглибинного” агента: звіти на 100+ сторінок за 8 годин

Sakana AI створює "надглибинного" агента: звіти на 100+ сторінок за 8 годин 1

Токійський стартап Sakana AI офіційно представив свій перший комерційний продукт — Sakana Marlin.

Позиціонований як “Віртуальний директор зі стратегії” (Virtual CSO), Marlin є автономним B2B дослідницьким агентом, який свідомо відмовляється від миттєвої генерації тексту, характерної для сучасних чат-ботів, на користь глибокого, довгострокового аналізу.

Що відрізняє Marlin від нинішньої екосистеми інструментів ШІ, так це його часовий масштаб: замість того, щоб надавати відповідь за секунди, він запускає безперервні, самокеровані цикли аналізу тривалістю до восьми годин, щоб підготувати глибоко досліджені, добре процитовані стратегічні звіти на 100 сторінок та презентації для керівництва. Компанія опублікувала зразки звітів, згенерованих Marlin, на своєму вебсайті з продуктом.

Платформа, доступна негайно через вебсайт компанії з початковими цінами за моделлю “оплата за використання”, призначена виключно для корпоративного сегменту, зокрема для великих компаній, фінансових установ та аналітичних центрів.

Характерний для генеративного ШІ ажіотаж значною мірою визначався швидкістю. Протягом останніх двох років галузевим стандартом була здатність генерувати вірш, рядок коду або поверхневий виклад за лічені мілісекунди. Однак, на підприємницькому фронті відбувається швидкий зсув від неглибокої, швидкої генерації до глибокого, методичного аналізу.

З Marlin великі бізнеси більше не запитують, наскільки швидко ШІ може відповісти, а наскільки глибоко він може мислити.

Продукт: Віртуальний Директор зі Стратегії

Що саме отримує бізнес, розгортаючи Sakana Marlin? Робочий процес фундаментально відрізняється від типових взаємодій з великими мовними моделями (LLM). Замість того, щоб брати участь у виснажливому процесі налаштування запитів, користувач просто надає основну тему дослідження. Після короткого початкового обміну для уточнення масштабу та напрямку дослідження, людина повністю відсторонюється.

Протягом наступних кількох годин Marlin працює як самодостатня цифрова команда зі стратегічного планування. Він формує власні початкові гіпотези, переглядає веб, щоб зібрати дані, перехресно звіряє джерела для перевірки висновків та визначає причинно-наслідкові зв’язки в складних бізнес-середовищах. По суті, він шукає “формулу успіху” серед інформаційного шуму.

Розглядайте його менше як пошукову систему, а більше як молодшого стратегічного консультанта, замкненого в кімнаті з дошкою та доступом до Інтернету. Ви надаєте стратегічний запит вранці, а до кінця робочого дня система надає комплексне портфоліо професійного рівня.

У випадку Marlin, кінцевий результат — це не загальний текстовий блок; це структурований набір стратегічних опцій, що включає резюме для керівництва, додатки, посилання та глибоко досліджений звіт.

Компанія навела кілька прикладів реальних сценаріїв використання для демонстрації здатності Marlin до складного синтезу, зокрема генерацію детальних сценаріїв вирішення теоретичної блокади Ормузької протоки, аналіз фрагментованої карти регулювання ШІ у світі та дослідження макроекономічних тенденцій, таких як повернення “облігаційних месників”.

Sakana стверджує, що Marlin використовує кілька моделей ШІ, але не надала конкретних назв моделей чи постачальників. Я звернувся до них у X, щоб дізнатися більше, і оновлю інформацію, коли отримаю відповідь.

VB Transform · 14–15 липня · Менло-Парк · LLMs, ops & evals

Стандартні бенчмарки не працюють. Amazon та Waymo пояснюють, що вони тестують натомість.

Відстеження оцінок заглиблюється в чотири виміри надійності — послідовність, стійкість, передбачуваність, безпека — та як команди в Amazon та Waymo впроваджують їх на практиці.

Дивитися повну програму →

Двигун Довгострокового Аналізу

Під капотом Marlin — це комерційний результат масштабних лабораторних проривів Sakana AI за останні два роки.

Продукт працює на основі дослідницького рушія, що спирається на власний попередній дослідницький прорив Sakana — адаптивний Монте-Карло пошук з розгалуженням (Adaptive Branching Monte Carlo Tree Search, AB-MCTS). Він використовує фреймворки, похідні від “AI Scientist” — попереднього дослідницького проєкту Sakana AI, опублікованого в журналі Nature, який успішно автоматизував процес наукових відкриттів від ідеї до рецензування.

Щоб зрозуміти, як це працює на практиці, проведімо аналогію з реальним світом: сучасні шахові рушії. Коли комп’ютер грає в шахи, він не просто дивиться на дошку і вгадує; він розігрує тисячі потенційних майбутніх ходів, оцінюючи силу кожної позиції, що виникла, перш ніж зробити хід.

Рушій AB-MCTS від Marlin робить щось подібне для досліджень.

Всередині Рушія: Механіка AB-MCTS

Хронологія цієї технології сягає червня 2025 року, коли Sakana AI вперше представила фреймворк громадськості разом із дослідницькою статтею “Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search”.

Тоді, для заохочення експериментів розробників з колективним інтелектом ШІ, компанія випустила базовий алгоритм як бібліотеку програмного забезпечення з відкритим кодом під назвою TreeQuest, що поширюється за дозвільною ліцензією Apache 2.0. Ця віха з відкритим кодом заклала технічну основу для того, що згодом, через рік, еволюціонувало в пропрієтарний продукт Marlin корпоративного рівня.

Традиційно, коли розробники намагаються отримати вищу якість аналізу від великих мовних моделей, вони вдаються до методу грубої сили, що називається “повторна вибірка” — по суті, паралельний запуск моделі десятки разів і сподівання, що одна з відповідей буде правильною. Однак, повторна вибірка працює наосліп; вона не може оцінити власні проміжні кроки або змінити напрямок на основі зовнішнього зворотного зв’язку.

AB-MCTS замінює цю парадигму принциповим, багатоетапним підходом, керованим байєсівською моделлю прийняття рішень. Під час підготовки звіту зі стратегії ШІ розглядає процес дослідження як розгалужене дерево можливостей. На кожному вузлі дерева алгоритм динамічно збалансовує дві різні поведінки на основі зовнішніх сигналів зворотного зв’язку:

  • Розширення (Exploration): Запуск абсолютно нових, альтернативних гіпотез або кандидатів на відповіді, коли поточний шлях дає спадну віддачу або призводить до невирішених протиріч.

  • Поглиблення (Exploitation): Методичне вдосконалення, аудит та розширення існуючого кандидата, який демонструє високий стратегічний потенціал.

Що перетворює це з лабораторного експерименту на комерційний рушій, так це його розширення до Multi-LLM AB-MCTS.

Архітектура Sakana AI вводить критично третій вимір дерева пошуку: здатність динамічно вибирати, яку модель викликати для конкретного підзавдання, розглядаючи провідні моделі галузі як колективну мережу інтелекту, що підключається та працює.

Згідно з технічною документацією, опублікованою компанією, рушій може координувати високогетерогенні моделі — дозволяючи моделі оркестрації делегувати початкову ідею одній LLM, тоді як модель, орієнтована на аналіз, аудитує, перевіряє та виправляє проміжні помилки, згенеровані раніше в дереві пошуку.

Завдяки масштабуванню обчислювальних потужностей під час висновку — використовуючи відмінні “особистості” та сильні сторони численних базових моделей протягом тисяч автоматизованих циклів — AB-MCTS надає математичні запобіжники, необхідні Marlin. Це гарантує, що отримані 100-сторінкові стратегічні звіти є не просто багатослівними генераціями ШІ, а високоперевіреним продуктом системної, автоматизованої спроби та помилки.

Ліцензування, Дані та Корпоративні Наслідки

Важливо зазначити, що Sakana Marlin — це, очевидно, не загальний споживчий інструмент; це комерційна послуга програмного забезпечення як послуга (SaaS), обмежена для корпоративних суб’єктів, організацій та приватних підприємців.

Для підприємств умови ліцензування та обробки даних часто є вирішальними факторами при прийнятті програмного забезпечення. На відміну від багатьох інструментів ШІ споживчого рівня, які мовчки збирають вхідні дані користувачів та пропрієтарні дані для навчання майбутніх базових моделей, Sakana Marlin працює відповідно до суворої політики даних корпоративного рівня.

Ні Sakana AI, ні її зовнішні постачальники послуг ШІ не використовуватимуть дані клієнтів або вхідні дані для навчання або доналаштування моделей, якщо клієнт не надасть явну згоду на участь.

Навіть за наявності згоди, дані ретельно обробляються для видалення персонально ідентифікованої інформації. Ця замкнена безпека є абсолютно життєво важливою для компаній, що обробляють конфіденційні дослідження злиття та поглинання, стратегії продуктів, які ще не випущені, або пропрієтарний ринковий аналіз.

Комерційне ліцензування структуроване за багаторівневими моделями ціноутворення, що відображають його корпоративний характер:

  • Оплата за використання: Користувачі можуть купувати кредити за запитом, при цьому один запуск коштує 100 кредитів, а додаткові кредити коштують ¥98 (приблизно $0.61 USD) кожен.

  • Pro Plan: За ¥150,000 (приблизно $935.68 USD) на місяць бізнеси отримують 2000 кредитів, знижуючи вартість додаткових кредитів до ¥90 (приблизно $0.56 USD).

  • Team Plan: Розрахований на більші відділи, цей план за ¥400,000 (приблизно $2,495.14 USD) на місяць включає 6000 кредитів, знижуючи вартість додаткових кредитів до ¥85 (приблизно $0.53 USD) за кредит.

  • Enterprise: Повністю індивідуальні пропозиції з виділеною підтримкою та індивідуальними розподілами кредитів.

Чому Sakana Варто Спостерігати

Перехід Sakana AI до комерційних, довгострокових агентів ґрунтується на репутації її засновників, які відомі тим, що допомогли розпалити нинішній бум генеративного ШІ.

Заснована в Токіо у 2023 році, компанія була співзаснована Ліоном Джонсом — співавтором знакової статті Google 2017 року “Attention Is All You Need”, який вигадав термін “transformer”, — і Девідом Ха, колишнім дослідником Google Brain та керівником відділу досліджень у Stability AI.

Рішення створити нову лабораторію поза межами бульбашки Кремнієвої долини було свідомим відхиленням від нинішньої екосистеми ШІ. На конференції TED AI наприкінці 2025 року Джонс відверто заявив, що йому “абсолютно набридли” трансформери, попередивши, що інтенсивний тиск з боку інвесторів та гіперфокусування на масштабуванні єдиних, монолітних моделей закам’яніли креативність індустрії та засліпили дослідників до наступного великого прориву.

Щоб звільнитися від цієї “хвороби великих компаній”, Джонс і Ха структурували Sakana AI на принципах біомімікрії та еволюційних обчислень.

Назва компанії, що походить від японського слова “риба”, відображає її ключову технічну філософію: використання колективного інтелекту, подібного до зграй риб, мурашників або роїв комах. Замість того, щоб намагатися побудувати одну величезну, універсальну базову модель, дослідження Sakana послідовно зосереджувалися на розгортанні мереж менших, спеціалізованих моделей, які динамічно співпрацюють для адаптації до складних середовищ.

Ця філософія стверджує, що розглядаючи окремі моделі ШІ як членів “дрим-тиму” з взаємодоповнюючими сильними сторонами, системи можуть досягти більш надійного та економічно ефективного аналізу, ніж покладаючись виключно на чистий масштаб.

Цей природно натхненний підхід швидко приніс дивіденди в суворих, конкурентних випробуваннях. Sakana AI досягла значних успіхів у “масштабуванні під час висновку” — розподілі обчислювальних ресурсів під час фази розв’язання проблеми, щоб дозволити моделям мислити, ітерувати та вдосконалювати власні відповіді протягом тривалого часу.

На початку 2026 року ALE-Agent компанії посів перше місце в надзвичайно складному конкурсі AtCoder Heuristic Contest (AHC058) — змаганні з комбінаторної оптимізації, перевершивши понад 800 провідних програмістів, автономно перебудовуючи та тестуючи сотні рішень протягом чотиригодинного вікна.

Аналогічно, Sakana представила “RL Conductor”, невелику модель з 7 мільярдами параметрів, навчену за допомогою навчання з підкріпленням спеціально для оркестрації та делегування завдань різноманітному пулу робочих моделей — від GPT-5 до Claude Sonnet 4 — досягаючи найсучасніших результатів на бенчмарках міркувань за частку традиційних витрат на обчислення.

Швидка еволюція Sakana від революційної дослідницької лабораторії до комерційного постачальника програмного забезпечення привернула інтенсивну увагу від глобальних фінансових важковаговиків.

До кінця 2025 року токійський стартап забезпечив собі масштабний раунд фінансування Серії B, який підняв його вартість після раунду вище $2.6 мільярда, закріпивши його статус однієї з найдорожчих приватних технологічних компаній Японії. Компанія має широкий список стратегічних інвесторів, включаючи ранніх венчурних інвесторів Khosla Ventures, Lux Capital та New Enterprise Associates (NEA), а також титанів галузі, таких як Nvidia та Google.

Оскільки Sakana розширює свою діяльність на критично важливі сектори, такі як оборона та фінанси, вона також залучила інвестиції від великих глобальних банківських установ, таких як Mitsubishi UFJ Financial Group (MUFG) та Citi, а також від гіганта корпоративних технологій Salesforce, позиціонуючи стартап для активного перетворення корпоративної ІТ-інфраструктури з нуля.

Реакція Спільноти та Польові Випробування

Перехід Sakana AI до комерційних, довгострокових агентів не відбувся у вакуумі. Компанія провела ретельне закрите бета-тестування, починаючи з квітня 2026 року, передавши інструмент приблизно 300 фахівцям з фінансових установ, консалтингових фірм та аналітичних центрів. Відгуки підкреслюють разючу якісну різницю між стандартними генеративними чат-ботами та автономним, керованим фактами підходом Marlin.

Старший консультант однієї з провідних консалтингових фірм Токіо зазначив, що інструмент “перевершив очікування, виявивши кути, які ми навіть не уявляли”, високо оцінюючи його здатність відповідати людській вичерпності, усуваючи людську упередженість. Тим часом, відділ кібербезпеки великого японського системного інтегратора похвалив систему за надання “дуже переконливого звіту, керованого високоякісними первинними дослідженнями”, а не покладаючись на вторинні джерела, що були перероблені.

У соціальних мережах оголошення компанії знайшло відгук у зростаючому прагненні ширшої технологічної спільноти до автономних агентів.

З розвитком індустрії ШІ, пропозиція цінності чітко змінюється. Інструменти, що діють як швидкі, розмовні енциклопедії, стають товаром. З Sakana Marlin фокус повністю переміщується з важкої роботи з аналізу на остаточний акт прийняття рішень. Делегуючи вичерпне картографування причинно-наслідкових зв’язків агенту, здатному до тривалого аналізу, людські керівники вільні робити те, що вони роблять найкраще: діяти.

Прогноз ІТ-Блогу: Marlin представляє собою важливий крок у бік еволюції ШІ від генеративних моделей до інструментів глибокого аналізу. У найближчі 1-2 роки ми, ймовірно, побачимо появу конкурентів, які намагатимуться відтворити цю модель довготривалого, автономного дослідження, що може призвести до значного підвищення продуктивності в корпоративному секторі.

Дізнатися більше на: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *