Xiaomi приголомшує: новий MiMo-V2-Pro демонструє продуктивність на рівні GPT-5.2 та Opus 4.6 за мізерну ціну

Китайський виробник електроніки та автомобілів Xiaomi вразив світову спільноту штучного інтелекту випуском MiMo-V2-Pro – нової фундаментальної моделі з 1 трильйоном параметрів. Її показники наближаються до показників американських ШІ-гігантів OpenAI та Anthropic, проте вартість доступу через пропрієтарний API становить приблизно сьому чи шосту частину від їхньої, а головне, модель обмінюється менш ніж 256 000 токенів інформації за раунд.

Проєкт, очолюваний Фулі Луо, ветераном проривного проєкту DeepSeek R1, представляє собою те, що Луо характеризує як “тихий амбуш” на глобальній арені. Крім того, Луо заявив у дописі на X, що компанія планує випустити відкриту версію моделі з цього останнього релізу, “коли моделі стануть достатньо стабільними, щоб це заслуговувати”.

Зосередившись на “просторі дій” інтелекту – переході від генерації коду до автономної роботи цифрових “кігтів” – Xiaomi прагне повністю обійти розмовний парадигм.

До своєї цієї вилазки у сферу передових ШІ, Xiaomi, що базується в Пекіні, зарекомендувала себе як титан “Інтернету Речей” та споживчого обладнання.

Глобально визнана третім найбільшим виробником смартфонів у світі, Xiaomi в першій половині 2020-х років здійснила ризикований вихід на автомобільний ринок. Її електромобілі, такі як SU7 та нещодавно випущений YU7 SUV, перетворили компанію на вертикально інтегрованого гіганта, здатного поєднувати апаратне забезпечення, програмне забезпечення, а тепер і передове мислення.

Ця спадщина у сфері інженерії фізичного світу інформує архітектуру MiMo-V2-Pro: вона побудована як “мозок” складних систем, чи то управління глобальними ланцюгами постачання, чи то навігація в заплутаних структурах автономного кодуючого агента.

Технологія: Архітектура агентності

Центральним викликом “Ери Агентів” є підтримка високоточного мислення протягом величезних обсягів даних без дорогої “податку на інтелект” у вигляді затримок чи витрат. MiMo-V2-Pro вирішує цю проблему завдяки розрідженій архітектурі: хоча вона містить 1T загальних параметрів, лише 42B активні під час одного прогону, що робить її приблизно втричі більшою за попередню MiMo-V2-Flash.

Ефективність моделі ґрунтується на вдосконаленому гібридному механізмі уваги. Стандартні трансформери зазвичай стикаються з квадратичним зростанням обчислювальних потреб зі збільшенням контексту; MiMo-V2-Pro використовує гібридне співвідношення 7:1 (збільшене з 5:1 у версії Flash) для управління величезним вікном контексту в 1 мільйон токенів. Це архітектурне рішення дозволяє моделі зберігати глибоку “пам’ять” про довготривалі завдання без зниження продуктивності, яке зазвичай спостерігається у передових моделях.

Аналогія: уявляйте модель не як студента, що читає книгу сторінка за сторінкою, а як експерта-дослідника у величезній бібліотеці. Співвідношення 7:1 дозволяє моделі “проглядати” 85% даних для отримання контексту, застосовуючи високощільну увагу до 15% найбільш релевантних для завдання.

Це доповнюється легким шаром Multi-Token Prediction (MTP), який дозволяє моделі передбачати та генерувати кілька токенів одночасно, різко зменшуючи затримку, необхідну для фаз “мислення” в агентських робочих процесах. За словами Луо, ці структурні рішення були прийняті заздалегідь, спеціально для того, щоб забезпечити “структурну перевагу” перед несподіваною швидкістю, з якою галузь перейшла до агентів.

Продукт та бенчмаркінг: Перевірка реальності від третьої сторони

Xiaomi приголомшує: новий MiMo-V2-Pro демонструє продуктивність на рівні GPT-5.2 та Opus 4.6 за мізерну ціну 2

Внутрішні дані Xiaomi малюють картину моделі, яка перевершує синтетичні бенчмарки у “реальних” завданнях. На GDPval-AA, бенчмарку, що вимірює продуктивність у реальних робочих завданнях агентів, MiMo-V2-Pro досягла Elo 1426, випередивши великих китайських конкурентів, таких як GLM-5 (1406) та Kimi K2.5 (1283).

Хоча вона все ще поступається західним “максимальним” моделям, таким як Claude Sonnet 4.6 (1633), у чистому Elo, вона демонструє найвищу зафіксовану продуктивність серед моделей китайського походження в цій категорії.

Стороння бенчмаркінгова організація Artificial Analysis підтвердила ці заяви, помістивши MiMo-V2-Pro на 10-те місце у своєму глобальному Індексі Інтелекту з показником 49. Це ставить її в один ряд з GPT-5.2 Codex і вище за Grok 4.20 Beta. Ці результати свідчать про те, що Xiaomi успішно створила модель, здатну до високорівневого мислення, необхідного для інженерних та виробничих завдань.

Xiaomi приголомшує: новий MiMo-V2-Pro демонструє продуктивність на рівні GPT-5.2 та Opus 4.6 за мізерну ціну 3

Ключові показники від Artificial Analysis підкреслюють значний стрибок порівняно з попередньою версією з відкритим кодом, MiMo-V2-Flash (яка отримала 41 бал):

Рівень галюцинацій: Модель Pro знизила рівень галюцинацій до 30% – це значне покращення порівняно з 48% у моделі Flash.
Індекс всезнання: Вона отримала +5 балів, випередивши GLM-5 (+2) та Kimi K2.5 (-8).
Ефективність токенів: Для роботи з усім Індексом Інтелекту MiMo-V2-Pro потребувала лише 77 мільйонів вихідних токенів, що значно менше, ніж у GLM-5 (109 мільйонів) або Kimi K2.5 (89 мільйонів), вказуючи на більш стислий та ефективний процес мислення.

Власні графіки Xiaomi додатково підкреслюють її можливості як “Загального Агента” та “Агента Кодування”. На ClawEval, бенчмарку для агентських структур, модель показала результат 61.5, наближаючись до продуктивності Claude Opus 4.6 (66.3) і значно випереджаючи GPT-5.2 (50.0). У специфічних для кодування середовищах, таких як Terminal-Bench 2.0, вона досягла 86.7, що свідчить про високу надійність при виконанні команд у реальному середовищі терміналу.

Як підприємствам слід оцінювати MiMo-V2-Pro для використання

Для ролей, окреслених у сучасних ШІ-організаціях – від інфраструктури до безпеки – MiMo-V2-Pro представляє зміну парадигми в кривій “Ціна-Якість”.

Відповідальні за інфраструктуру знайдуть MiMo-V2-Pro переконливим кандидатом на парето-фронтір інтелекту проти витрат. Artificial Analysis повідомила, що вартість запуску їхнього індексу становила лише 348 доларів для MiMo-V2-Pro, порівняно з 2304 доларами для GPT-5.2 та 2386 доларами для Claude Opus 4.6.

Для організацій, що керують GPU-кластерами або закупівлями, можливість отримати доступ до топ-10 глобального інтелекту за приблизно 1/7 вартості західних лідерів є потужним стимулом для тестування у виробничому масштабі.

Відповідальні за дані можуть використовувати 1-мільйонне контекстне вікно для архітектур, готових до RAG, що дозволяє їм подавати повні кодові бази підприємства або набори документації в один запит без фрагментації, необхідної для моделей з меншим контекстом.

Відповідальний за системи/оркестрацію повинен оцінювати MiMo-V2-Pro як основний “мозок” для координації мульти-агентних систем. Оскільки модель оптимізована для OpenClaw та Claude Code, вона може обробляти довгострокове планування та точне використання інструментів без постійного людського втручання, яке спостерігається у ранніших моделях.

Її високий рейтинг у GDPval-AA свідчить про те, що вона особливо добре підходить для рівня робочих процесів та оркестрації, необхідного для масштабування ШІ в межах підприємства. Вона дозволяє створювати системи, які можуть вийти за рамки простої автоматизації до складного, багатоетапного вирішення проблем.

Однак, відповідальні за безпеку повинні діяти обережно. Сама “агентська” природа, яка робить модель потужною – її здатність використовувати термінали та маніпулювати файлами – збільшує поверхню атаки для ін’єкцій у промпт та несанкціонованого доступу до моделі.

Хоча її низький рівень галюцинацій (30%) є захисною перевагою, відсутність загальнодоступних ваг (на відміну від версії Flash) означає, що внутрішні команди безпеки не можуть проводити глибокий аудит на рівні моделі, який іноді потрібен для високочутливих розгортань. Будь-яке впровадження на підприємстві повинно супроводжуватися надійними протоколами моніторингу та аудиту.

Ціноутворення, доступність та подальший шлях

Xiaomi встановила ціни на MiMo-V2-Pro з метою домінування на ринку розробників. Ціни мають багаторівневу структуру залежно від використання контексту, з конкурентними ставками для кешування для підтримки завдань високочастотного мислення.

MiMo-V2-Pro (до 256K): 1 долар за 1 мільйон вхідних токенів і 3 долари за 1 мільйон вихідних токенів
MiMo-V2-Pro (256K-1M): 2 долари за 1 мільйон вхідних токенів і 6 доларів за 1 мільйон вихідних токенів
Читання кешу: 0.20 долара за 1 мільйон токенів для нижнього рівня та 0.40 долара для вищого рівня
Запис кешу: Тимчасово безкоштовно (0 доларів)

Ось як це співвідноситься з іншими провідними передовими моделями у світі:

Модель	Вхід	Вихід	Загальна вартість	Джерело
Grok 4.1 Fast	0.20 долара	0.50 долара	0.70 долара	xAI
MiniMax M2.7	0.30 долара	1.20 долара	1.50 долара	MiniMax
Gemini 3 Flash	0.50 долара	3.00 долара	3.50 долара	Google
Kimi-K2.5	0.60 долара	3.00 долара	3.60 долара	Moonshot
MiMo-V2-Pro (≤256K)	1.00 долар	3.00 долара	4.00 долара	Xiaomi MiMo
GLM-5-Turbo	0.96 долара	3.20 долара	4.16 долара	OpenRouter
GLM-5	1.00 долар	3.20 долара	4.20 долара	Z.ai
Claude Haiku 4.5	1.00 долар	5.00 долара	6.00 долара	Anthropic
Qwen3-Max	1.20 долара	6.00 долара	7.20 долара	Alibaba Cloud
Gemini 3 Pro	2.00 долара	12.00 долара	14.00 долара	Google
GPT-5.2	1.75 долара	14.00 долара	15.75 долара	OpenAI
GPT-5.4	2.50 долара	15.00 долара	17.50 долара	OpenAI
Claude Sonnet 4.5	3.00 долара	15.00 долара	18.00 долара	Anthropic
Claude Opus 4.6	5.00 долара	25.00 долара	30.00 долара	Anthropic
GPT-5.4 Pro	30.00 долара	180.00 долара	210.00 долара	OpenAI

Це агресивне позиціонування покликане стимулювати інтенсивні потоки застосунків, які визначають наступне покоління програмного забезпечення. Модель наразі доступна лише через власний API Xiaomi, без підтримки введення зображень чи мультимодальності – помітне упущення в епоху “Omni”-моделей, хоча Xiaomi вже анонсувала окрему MiMo-V2-Omni для цих потреб.

“Мисливський Альфа” період на OpenRouter довів, що ринок має високий попит на таке специфічне поєднання ефективності та мислення. Філософія Фулі Луо – що швидкість досліджень підживлюється “щирою любов’ю до світу, для якого ви його будуєте” – призвела до створення моделі, яка займає 2-ге місце в Китаї та 8-ме у світі за встановленими індексами інтелекту.

Залишиться це “тихим” амбушем чи стане основою для глобального переформатування влади у сфері ШІ, залежить від того, наскільки швидко розробники перейдуть від “вікна чату” до “простору дій”. Наразі Xiaomi змінила правила гри: питання полягає вже не в тому, “чи може він говорити?”, а в тому, “чи може він діяти?”.

Прогноз ІТ-Блогу: MiMo-V2-Pro задає новий стандарт економічної ефективності для передових мовних моделей, що може спровокувати цінову війну серед великих гравців ринку. Очікується, що Xiaomi розширить свої мультимодальні можливості, конкуруючи безпосередньо з GPT-4o та Gemini, що посилить конкуренцію та прискорить інновації в цій сфері.

Оригінал статті: venturebeat.com

Технологія: Архітектура агентності

Продукт та бенчмаркінг: Перевірка реальності від третьої сторони

Як підприємствам слід оцінювати MiMo-V2-Pro для використання

Ціноутворення, доступність та подальший шлях

Залишити відповідьСкасувати відповідь