
Кілька годин тому китайська компанія-розробник додатків для доставки Meituan офіційно представила LongCat-2.0 на GitHub, Hugging Face та своїй власній платформі. Ця модель є обчислювальним рушієм, що стоїть за “Owl Alpha” — анонімною стелс-моделлю, яка протягом останніх двох місяців очолювала глобальні рейтинги розробників на OpenRouter.
Система Mixture-of-Experts (MoE) з 1,6 трильйонами параметрів, розроблена для фундаментального руйнування домінування закритих корпоративних рішень у сфері автономної розробки програмного забезпечення, тепер доступна публічно. Вона пропонує нативне контекстне вікно обсягом 1 мільйон токенів під надзвичайно гнучкою, придатною для комерційного використання ліцензією MIT.
Комерційний доступ до архітектури передбачає дуже агресивну цінову політику. Впроваджено механізм, за яким усі запити, що потрапляють до кешу контексту, обробляються абсолютно безкоштовно. Це доповнюється тимчасовою акцією “Token Pack” (Пакет Токенів) за вигідною ціною. Також існує стандартний API “плати за використання” для запитів, що не потрапляють до кешу, за стандартною ціною $0.75/$2.95 за мільйон вхідних/вихідних токенів.
Проте, обмежений за часом промо-дисконт агресивно знижує ці операційні витрати до $0.30 за мільйон вхідних токенів та $1.20 за мільйон вихідних токенів. Обидва показники перебувають на нижньому рівні серед провідних світових моделей.
|
Модель |
Вхід ($/1M) |
Вихід ($/1M) |
Разом ($/1M) |
Джерело |
|
MiMo-V2.5 Flash |
$0.10 |
$0.30 |
$0.40 |
Xiaomi |
|
deepseek-v4-flash |
$0.14 |
$0.28 |
$0.42 |
DeepSeek |
|
deepseek-v4-pro |
$0.435 |
$0.87 |
$1.305 |
DeepSeek |
|
MiniMax-M3 |
$0.30 |
$1.20 |
$1.50 |
MiniMax |
|
LongCat-2.0 — тимчасова промо-акція |
$0.30 |
$1.20 |
$1.50 |
LongCat |
|
Gemini 3.1 Flash-Lite |
$0.25 |
$1.50 |
$1.75 |
|
|
Qwen3.7-Plus |
$0.40 |
$1.60 |
$2.00 |
Alibaba Cloud |
|
MiMo-V2.5 |
$0.40 |
$2.00 |
$2.40 |
Xiaomi |
|
LongCat-2.0 — стандартний тариф |
$0.75 |
$2.95 |
$3.70 |
LongCat |
|
Grok 4.3 (малий контекст) |
$1.25 |
$2.50 |
$3.75 |
xAI |
|
MiMo-V2.5 Pro (≤256K) |
$1.00 |
$3.00 |
$4.00 |
Xiaomi |
|
Kimi-K2.6 |
$0.95 |
$4.00 |
$4.95 |
Moonshot AI |
|
GLM-5.2 |
$1.40 |
$4.40 |
$5.80 |
Z.ai |
|
GPT-5.6 Luna |
$1.00 |
$6.00 |
$7.00 |
OpenAI |
|
Grok 4.3 (великий контекст) |
$2.50 |
$5.00 |
$7.50 |
xAI |
|
MiMo-V2.5 Pro (>256K) |
$2.00 |
$6.00 |
$8.00 |
Xiaomi |
|
Qwen3.7-Max |
$2.50 |
$7.50 |
$10.00 |
Alibaba Cloud |
|
Gemini 3.5 Flash |
$1.50 |
$9.00 |
$10.50 |
|
|
Gemini 3.1 Pro Preview (≤200K) |
$2.00 |
$12.00 |
$14.00 |
|
|
GPT-5.6 Terra |
$2.50 |
$15.00 |
$17.50 |
OpenAI |
|
GPT-5.4 |
$2.50 |
$15.00 |
$17.50 |
OpenAI |
|
Gemini 3.1 Pro Preview (>200K) |
$4.00 |
$18.00 |
$22.00 |
|
|
Claude Opus 4.8 |
$5.00 |
$25.00 |
$30.00 |
Anthropic |
|
GPT-5.5 |
$5.00 |
$30.00 |
$35.00 |
OpenAI |
|
GPT-5.5 Instant (chat-latest) |
$5.00 |
$30.00 |
$35.00 |
OpenAI |
|
Sakana Fugu Ultra (≤272K) |
$5.00 |
$30.00 |
$35.00 |
Sakana AI |
|
GPT-5.6 Sol |
$5.00 |
$30.00 |
$35.00 |
OpenAI |
|
Claude Fable 5 / Claude Mythos 5 |
$10.00 |
$50.00 |
$60.00 |
Anthropic |
Випуск LongCat-2.0 є визначальним моментом для глобальної технологічної інфраструктури завдяки своїй операційній незалежності. Ця масштабна модель була повністю навчена на кластері з понад 50 000 вітчизняних китайських спеціалізованих інтегральних схем (ASIC), доводячи, що моделі рівня передових розробок можна успішно масштабувати без залежності від типових американських GPU від NVIDIA, які до цього часу живили значну частину глобальних зусиль з тренування передових генеративних моделей ШІ.
Успішне розгортання альтернативних чіпів сигналізує про глибоку структурну зміну. Якщо китайські конгломерати зможуть послідовно вдосконалювати архітектури з трильйонами параметрів, використовуючи власні ASIC замість універсальних GPU, це може поставити під загрозу домінування NVIDIA у цьому секторі.
Важливо, що цей технологічний поворот відбувається саме в той час, коли Вашингтон чинить тиск на провідні американські лабораторії з метою обмеження доступу до їхніх найновіших моделей. Після запиту уряду США, OpenAI була змушена обмежити доступ до своїх нових моделей GPT-5.6, тоді як Anthropic раніше також отримала наказ від США обмежити доступ до своїх останніх моделей Claude Fable 5 / Mythos 5, повністю вивівши їх з експлуатації. Водночас, зростаюча кількість технологів, активістів та галузевих експертів попереджає, що ці оборонні регуляторні маневри мають зворотний ефект. Обмежуючи доступ до західних закритих моделей та підвищуючи вартість API, уряд США створює широке операційне вікно для глобальних розробників, які шукають доступні, високоефективні альтернативи, подібні до тих, що пропонуються китайськими моделями з відкритим кодом, такими як Meituan LongCat-2.0.
Сирі операційні показники підтвердили захоплення розробників: під час свого анонімного перебування на OpenRouter, Owl Alpha обробляла приблизно 10,1 трильйона токенів на місяць, що в середньому становить 559 мільярдів токенів на день. Це демонструє 242% зростання обсягу місяць до місяця, що дозволило їй увійти до топ-3 платформи.
До моменту, коли Meituan виступила з заявою про авторство архітектури, модель вже посіла перше місце в робочому просторі Hermes Agent, друге місце в розгортаннях Claude Code та третє місце в міжнародних середовищах OpenClaw.
Технології: Інженерія 1М-Токенового Розрідженого Контексту
В основі LongCat-2.0 лежить агресивна оптимізація розрідженості Mixture-of-Experts (MoE), що дозволяє масштабувати загальну кількість параметрів до 1,6 трильйона, обмежуючи активні обчислення в середньому 48 мільярдами параметрів на токен.
Залежно від структурної складності запиту, динамічна активація моделі коливається від 33 до 56 мільярдів параметрів. Ця конструкція реалізує фреймворк “Zero-Compute Experts”, гарантуючи, що рутинні елементи виконання проходять через легші підмережі, повністю усуваючи невикористані обчислювальні накладні витрати, які зазвичай штрафують надмірно щільні моделі.
Щоб підтримувати функціональне контекстне вікно розміром 1 мільйон токенів без катастрофічних апаратних вузьких місць, Meituan представила LongCat Sparse Attention (LSA). Розроблена як еволюційна ітерація DeepSeek Sparse Attention, LSA вирішує проблеми квадратичної вартості оцінки та фрагментації пам’яті, які зазвичай ускладнюють дрібнозернисті розріджені механізми, через три чіткі, ортогональні вектори:
-
Індексація з урахуванням потоковості (SI): Ця система перебудовує конвеєр вибору токенів, змішуючи апаратно-орієнтоване зчитування суміжних даних з динамічним випадковим вибором. Перетворюючи фрагментований доступ до пам’яті на високопередбачувані, послідовні блоки, система досягає згрупованого використання High Bandwidth Memory (HBM) та підвищеної ефективної пропускної здатності.
-
Міжрівнева індексація (CLI): Використовуючи емпіричну реальність того, що увага залишається високостабільною між сусідніми прихованими шарами, CLI амортизує витрати на обчислення. Один прохід індексації успішно керує кількома послідовними шарами під час виведення, що підкріплюється міжрівневою дистиляцією протягом фази навчання.
-
Ієрархічна індексація (HI):** Цей підхід застосовує двоступеневу схему оцінки від грубого до точного. Індексатор виконує швидкий, приблизний пошук на рівні блоків для фільтрації кандидатів, перш ніж застосувати точний вибір токенів виключно до залишкової популяції.
Крім того, Meituan інтегрувала модуль N-gram Embedding, успадкований від своїх менших моделей. Розширюючи виділення параметрів у розріджених вимірах, що повністю ортогональні до макета експертів MoE, архітектура додає 135 мільярдів параметрів до системи комбінування 5-грамових токенів.
Це розширює простір базових вбудовувань приблизно в 100 разів, дозволяючи моделі фіксувати щільні локальні зв’язки токенів та прискорювати операції пакетного виведення, зменшуючи вузькі місця вводу/виводу пам’яті.
Продукт: Пост-тренування, Фреймворк MOPD та Результати Тестування
Хоча загальні великі мовні моделі надають перевагу плавним, розмовним інтерфейсам, LongCat-2.0 зосереджується виключно на багатоетапних інженерних завданнях, інтеграції інструментів та автоматизованому управлінні репозиторіями — тобто, агентних завданнях.
За стандартизованими оцінками, LongCat-2.0 демонструє емпіричний показник 59.5 на SWE-bench Pro, перевищуючи показник GPT-5.5 на рівні 58.6. Модель також підтверджує свою спеціалізацію як агент, набираючи 70.8 на Terminal-Bench 2.1, 77.3 на SWE-bench Multilingual та 73.2 на симуляторі корпоративних робочих процесів FORTE.

Ця точна операційна поведінка досягається завдяки структурному шару пост-тренування під назвою Multi-Teacher Optimization via Mixture of Specialized Experts (MOPD). Замість змішування сирих людських відгуків в єдину функцію винагороди, архітектура MOPD розділяє пост-тренувальну оптимізацію на три незалежні, високоспеціалізовані кластери експертів:
-
Агентні експерти: Це експерти, які пройшли точне доналаштування суто для структурного виконання, спеціалізуючись на точному виклику інструментів, парсингу параметрів API в багатооборотних діалогах та самокоригувальних механізмах циклів для уникнення стагнації виконання.
-
Резонуючі експерти: Оптимізовані ізольовано для просування багатоетапної логіки, складного інженерного мислення “ланцюжок думок”, математики та вирішення складних STEM-проблем.
-
Інтерактивні експерти: Повністю зосереджені на узгодженні з людиною, нюансах дотримання інструкцій, фактичному заземленні для придушення галюцинацій та підтримці жорстких безпекових обмежень без зниження загальної корисності моделі.
Розділяючи ці вектори під час пост-тренування, LongCat-2.0 запобігає функціональній деградації. Динамічний механізм маршрутизації гейтів потім безшовно об’єднує ці спеціалізовані поведінки під час виконання, дозволяючи фінальній моделі одночасно координувати глибоке мислення, стабільне виконання інструментів та безпечну взаємодію з користувачем.
Хоча LongCat-2.0 загалом поступається преміальним передовим системам, таким як Claude Opus 4.8, у широких загальноагентних тестах, як-от FORTE та BrowseComp, вона явно випереджає свій клас у сфері розробки програмного забезпечення. Те, що робить цю архітектуру з відкритими вагами особливою, — це її гіперфокус на автономній розробці; вона успішно незначно перевищує пропрієтарну GPT-5.5 від OpenAI у строгому тесті розробки програмного забезпечення SWE-bench Pro (набравши 59.5 проти 58.6), доводячи свою високу спроможність і конкурентоспроможність у складних завданнях кодування, незважаючи на менший обчислювальний слід.
Комерційна модель: Оплата за використання проти Пакетів Токенів
Стратегія розгортання Meituan вводить спеціалізовану комерційну модель, яка розділяє доступ до мережі між традиційним білінгом API в реальному часі та структурованими “Пакетами Токенів”.
Для традиційної корпоративної інтеграції доступні стандартні рахунки з поповненням, які в реальному часі списують операційний капітал на основі показників вводу та генерації токенів.
Однак, для задоволення непередбачуваних сплесків обчислень, характерних для автономних агентів розробки, Meituan запустила структурований фреймворк “Token Pack”. Ці пакети, придбані як фіксовані, одноразові об’ємні квоти, дійсні протягом суворого 30-денного періоду, додаються безпосередньо до існуючого базового облікового запису API організації.
Для управління навантаженням на мережу на своїх ASIC-кластерах Meituan випускає ці високооб’ємні пакети через обмежені флеш-розпродажі чотири рази на день, точно о 10:00, 16:00, 21:00 та 23:00 за пекінським часом на основі принципу “хто перший прийшов, той і отримав”. Економічною перевагою цього фреймворку є обробка кешованих запитів за нульовою вартістю.
У масивних агентних середовищах, де помічник з кодування повинен багаторазово читати, посилатися та модифікувати один і той самий репозиторій коду розміром у мільйони токенів протягом тривалої сесії, стандартні архітектури штрафують розробників, стягуючи повну плату за повторний контекст вводу. За інфраструктури Meituan лише запити, що не потрапили до кешу, та фінальна генерація токенів споживають квоту пакету. Ця архітектура повністю змінює економіку операційних витрат на великомасштабну розробку програмного забезпечення для агентів, дозволяючи глибоке ітераційне дослідження контексту без накопичення витрат.
Ліцензування: Структурна Свобода Відкритих Рішень
Зареєструвавши репозиторій LongCat-2.0 під відкритою ліцензією MIT, Meituan надає архітектурі максимальну юридичну гнучкість для корпоративної інтеграції.
На відміну від копілефт-парадигм, таких як GNU General Public License (GPL), яка юридично зобов’язує розробників відкривати вихідний код будь-яких похідних фреймворків або внутрішнього програмного забезпечення, що пов’язане з кодом, ліцензія MIT дозволяє майже необмежену свободу.
Для корпоративних інженерних команд цей юридичний стандарт гарантує, що LongCat-2.0 може бути глибоко модифікований, скомпільований та жорстко закодований безпосередньо у комерційні програми із закритим вихідним кодом, пропрієтарні інструменти розробки та внутрішні сервери автоматизації.
Корпорації можуть форкнути репозиторій, оптимізувати внутрішні механізми LSA для приватних баз даних та продавати отриманий програмний стек кінцевим користувачам без будь-яких зобов’язань розкривати свою пропрієтарну інтелектуальну власність або структурні вдосконалення.
Еволюція Meituan: Від Супер-Додатку До ШІ-Гіганта
Заснована у березні 2010 року підприємцем Ван Сінь, Meituan спочатку запустилася як сайт щоденних знижок у стилі Groupon, перш ніж швидко перетворитися на один із домінуючих китайських “супер-додатків”.
Після масштабного злиття у 2015 році з Dianping, пекінський технологічний гігант зміцнив домінуючу частку ринку в міських логістичних мережах країни, поєднуючи місцеві відгуки споживачів, миттєву торгівлю, бронювання готелів та доставку їжі. Працюючи як публічно зареєстрована компанія на Гонконгській фондовій біржі, Meituan має понад 770 мільйонів щорічних транзакційних користувачів та підтримує мережу з понад 14,5 мільйонів продавців.
Однак, зіткнувшись з інтенсивною внутрішньою ринковою конкуренцією, серйозним стисненням маржі та падінням прибутковості, компанія агресивно змінила свою стратегію, вийшовши за межі логістики. Meituan публічно зобов’язалася інвестувати “мільярди” в штучний інтелект та вітчизняні чіпові потужності для відродження своїх технологічно орієнтованих пропозицій.
Цей стратегічний перехід у глобальну гонку ШІ почав матеріалізуватися наприкінці 2025 року з випуском LongCat-Flash, базової моделі Mixture-of-Experts з 560 мільярдами параметрів, за якою швидко послідувала модель передового мислення LongCat-Flash-Thinking. Відкриваючи ці моделі передового класу під ліцензіями, зручними для бізнесу, Meituan сигналізувала про своє прагнення стати фундаментальним гравцем у глобальній інфраструктурі ШІ, а не залишатися суто регіональним гігантом електронної комерції та доставки.
Корпоративні Наслідки: Автономні Операційні Робочі Процеси
Для сучасних підприємств випуск LongCat-2.0 відкриває чіткі операційні стратегії в галузі розробки програмного забезпечення, системних операцій та інтерпретації довгострокових даних.
Поєднання моделі з відкритими вагами, ліцензованої MIT, з розширеним контекстним вікном на 1 мільйон токенів означає, що організації можуть обійти проблеми конфіденційності даних та періодичні накладні витрати, пов’язані з розміщенням пропрієтарних сторонніх API.
У великомасштабних корпоративних середовищах розробки команди можуть використовувати спеціалізованих Агентних Експертів моделі для оркестрації автономних міграцій кодової бази. Замість того, щоб витрачати сотні людино-годин на ручне переписування застарілих фреймворків додатків, інженери можуть передати весь корпоративний репозиторій разом із документацією сучасних SDK безпосередньо в контекстне вікно на 1 мільйон токенів. LongCat-2.0 може відобразити залежності, виконати структурні оновлення на рівні репозиторію, скомпілювати новий код та автономно виявити помилки компіляції та виконання в локальних пісочницях, перш ніж генерувати фінальний pull request.
Розділення архітектури моделі через механізм маршрутизації гейтів MOPD забезпечує значні переваги для суворого корпоративного відповідності. Маршрутизуючи конкретні операційні запити через ізольовані кластери експертів, фінансова установа або медична компанія може виконувати глибокий логічний аналіз та математичні обчислення, не ризикуючи фактичними галюцинаціями або порушенням суворих безпекових обмежень. Інтерактивні Експерти функціонують як неявний рівень безпеки, пригнічуючи помилки та забезпечуючи дотримання протоколів виконання інструкцій без зниження потужності обробки внутрішніх Резонуючих Експертів. У поєднанні з моделлю кешування з нульовою вартістю, підприємства можуть підтримувати високоспеціалізовані автономні мережі програмного забезпечення, які можуть багаторазово перевіряти корпоративні пули даних, постійно підтримуючи та оптимізуючи внутрішню інфраструктуру за частку стандартних операційних витрат.
Прогноз ІТ-Блогу: LongCat-2.0, з його безпрецедентним контекстним вікном та відкритою ліцензією, ймовірно, стане каталізатором для нових класів програмних агентів, які зможуть ефективніше працювати з величезними обсягами даних. Ця модель може суттєво знизити бар’єр входу для розробки складних автономних систем, що призведе до прискорення інновацій у сфері автоматизації та розробки ПЗ.
Подробиці можна знайти на сайті: venturebeat.com
