“Саморозвиток” ШІ: MiniMax M2.7 змінює правила гри в дослідженні навчання з підкріпленням

"Саморозвиток" ШІ: MiniMax M2.7 змінює правила гри в дослідженні навчання з підкріпленням 1

Китайський стартап MiniMax, що стрімко розвивається на глобальній арені штучного інтелекту, заявив про себе як про провідного розробника передових мовних моделей (LLM). Компанія здобула репутацію завдяки випуску потужних моделей з відкритим кодом, а раніше — високоякісних генераторів відео на базі ШІ (Hailuo).

Випуск нової пропрієтарної мовної моделі MiniMax M2.7 знаменує черговий важливий етап. Ця модель розроблена спеціально для забезпечення роботи ШІ-агентів та використання як бекенд для сторонніх інструментів, таких як Claude Code, Kilo Code та OpenClaw. Однак, що особливо відзначається, MiniMax використала M2.7 не лише для виконання завдань, але й для самовдосконалення: модель брала участь у побудові, моніторингу та оптимізації власних механізмів навчання з підкріпленням (reinforcement learning), замість того, щоб покладатися виключно на ручне доналаштування людьми.

Цей перехід до рекурсивного самовдосконалення вказує на новий напрямок розвитку індустрії — майбутнє, де моделі ШІ стають не лише продуктами людських досліджень, але й активними учасниками власного прогресу. M2.7 класифікується як модель, що спеціалізується на міркуваннях (reasoning-only text model), демонструючи інтелект, порівнянний з провідними системами, при значно вищій економічній ефективності.

Водночас, той факт, що M2.7 наразі є пропрієтарною, свідчить про зміну стратегії китайських стартапів. Після того, як протягом тривалого часу вони були лідерами у сфері відкритих рішень ШІ, що приваблювало підприємства завдяки низькій вартості та гнучкості, тепер компанії, подібно до американських гігантів OpenAI, Google та Anthropic, все частіше зосереджуються на розробці закритих, передових моделей.

MiniMax став другим китайським стартапом, який нещодавно представив пропрієтарну LLM найвищого рівня, після z.ai з її GLM-5 Turbo. Також ходять чутки, що команда Alibaba Qwen також переходить до пропрієтарної розробки після відходу ключових керівників та дослідників.

Технічне досягнення: Цикл саморозвитку

Визначальною характеристикою MiniMax M2.7 є її роль у власному створенні. Згідно з документацією компанії, попередні версії моделі використовувалися для розробки інструментарію (research agent harness), здатного керувати конвеєрами даних, середовищами навчання та інфраструктурою оцінювання.

"Саморозвиток" ШІ: MiniMax M2.7 змінює правила гри в дослідженні навчання з підкріпленням 2

Завдяки автономному аналізу журналів, налагодженню та метрикам, M2.7 самостійно виконала від 30% до 50% свого циклу розробки.

Це не просто автоматизація рутинних завдань; модель оптимізувала власну продуктивність, аналізуючи траєкторії помилок та плануючи зміни в коді протягом ітеративних циклів, що складалися зі 100 і більше раундів.

“Ми навмисно тренували модель бути кращою у плануванні та чіткому формулюванні вимог користувача”, – пояснив керівник інженерного відділу MiniMax Скайлер Мяо у соціальній мережі X. “Наступним кроком є створення більш складного симулятора користувача для подальшого просування цієї можливості”.

Ця здатність поширюється на складні середовища завдяки MLE Bench Lite – серії змагань з машинного навчання, призначених для тестування автономних дослідницьких навичок. У цих випробуваннях M2.7 досягла показника медалей на рівні 66,6%, що зрівнює її з новими моделями Google Gemini 3.1 і наближається до поточних найкращих показників Anthropic Claude Opus 4.6.

Мета MiniMax, як зазначається, полягає у переході до повної автономії архітектури навчання та висновку моделей без участі людини.

Еволюція продуктивності: MiniMax M2.7 проти M2.5

"Саморозвиток" ШІ: MiniMax M2.7 змінює правила гри в дослідженні навчання з підкріпленням 3

Порівняно з попередником M2.5, випущеним у лютому 2026 року, модель M2.7 демонструє значний прогрес у складних завданнях розробки програмного забезпечення та професійних офісних операціях. Якщо M2.5 відзначалася майстерністю кодування різними мовами, то M2.7 розроблена для реальних інженерних завдань, що потребують причинно-наслідкового аналізу в робочих виробничих системах.

Ключові показники продуктивності включають:

  • Розробка програмного забезпечення: M2.7 отримала 56,22% на бенчмарку SWE-Pro, що відповідає найвищим показникам глобальних конкурентів, таких як GPT-5.3-Codex.

  • Професійна офісна робота: У сфері обробки документів M2.7 досягла показника Elo 1495 на GDPval-AA, що, за даними компанії, є найвищим серед моделей з відкритим доступом.

  • Зменшення галюцинацій: Модель отримала плюс один бал за індексом AA-Omniscience, що є величезним стрибком порівняно з показником -40 у M2.5.

  • Рівень галюцинацій: M2.7 демонструє рівень галюцинацій 34%, що нижче за показники Claude Sonnet 4.6 (46%) та Gemini 3.1 Pro Preview (50%).

  • Розуміння систем: На Terminal Bench 2 модель показала результат 57,0%, демонструючи глибоке розуміння складної операційної логіки, а не лише генерацію коду.

  • Дотримання навичок: На оцінці MM Claw, яка тестує 40 складних навичок (кожна понад 2000 токенів), M2.7 показала 97% відповідності, що є суттєвим покращенням порівняно з базовим рівнем M2.5.

  • Паритет інтелекту: Здатність моделі до міркувань вважається еквівалентною GLM-5, проте вона використовує на 20% менше вихідних токенів для досягнення подібних результатів.

Еволюція моделі також підтверджується її результатом 50 за індексом Artificial Analysis Intelligence Index, що на 8 пунктів краще, ніж у її попередника, і забезпечує 8-ме місце серед глобальних лідерів за загальним рівнем інтелекту в різних доменах.

"Саморозвиток" ШІ: MiniMax M2.7 змінює правила гри в дослідженні навчання з підкріпленням 4

Втім, не всі незалежні сторонні бенчмарки показують покращення M2.7 порівняно з M2.5. На BridgeBench, наборі завдань, розробленому стартапом BridgeMind для тестування продуктивності моделі у “вільному кодуванні” (vibe coding), тобто перетворенні природної мови на робочий код, M2.5 посіла 12-те місце, тоді як M2.7 – 19-те.

Доступ, ціни та інтеграція

MiniMax M2.7 є пропрієтарною моделлю, доступною через API MiniMax та платформи створення агентів MiniMax. Хоча основні вагові коефіцієнти моделі M2.7 залишаються закритими, компанія продовжує підтримувати екосистему, роблячи внесок у відкритий проєкт OpenRoom.

Для прямої інтеграції через API та через стороннього постачальника OpenRouter, MiniMax M2.7 пропонує конкурентоспроможну ціну: 0,30 долара за 1 мільйон вхідних токенів та 1,20 долара за 1 мільйон вихідних токенів. Ця ціна не змінилася порівняно з M2.5, що робить M2.7 однією з найдоступніших передових моделей ШІ у світі. Дешевшою є лише Grok 4.1 Fast від xAI.

Модель

Вхідні токени

Вихідні токени

Загальна вартість

Джерело

Grok 4.1 Fast

$0.20

$0.50

$0.70

xAI

MiniMax M2.7

$0.30

$1.20

$1.50

MiniMax

Gemini 3 Flash

$0.50

$3.00

$3.50

Google

Kimi-K2.5

$0.60

$3.00

$3.60

Moonshot

GLM-5-Turbo

$0.96

$3.20

$4.16

OpenRouter

GLM-5

$1.00

$3.20

$4.20

Z.ai

Claude Haiku 4.5

$1.00

$5.00

$6.00

Anthropic

Qwen3-Max

$1.20

$6.00

$7.20

Alibaba Cloud

Gemini 3 Pro

$2.00

$12.00

$14.00

Google

GPT-5.2

$1.75

$14.00

$15.75

OpenAI

GPT-5.4

$2.50

$15.00

$17.50

OpenAI

Claude Sonnet 4.5

$3.00

$15.00

$18.00

Anthropic

Claude Opus 4.6

$5.00

$25.00

$30.00

Anthropic

GPT-5.4 Pro

$30.00

$180.00

$210.00

OpenAI

Для підтримки різних масштабів використання та модальностей, MiniMax пропонує структурований “План Токенів” з різними рівнями підписки. Ці плани дозволяють користувачам отримувати доступ до моделей, що охоплюють текст, мову, відео, зображення та музику, в межах єдиної уніфікованої квоти.

Для стимулювання подальшого впровадження MiniMax запустила реферальну програму “Запрошуй та Заробляй”, надаючи 10% знижку для нових запрошених користувачів та 10% кешбек-ваучер для запрошувача.

Ціни стандартного місячного Плану Токенів: Щомісячні стандартні рівні розроблені для початківців та досвідчених користувачів.

  • Starter: $10 на місяць за 1500 запитів кожні 5 годин.

  • Plus: $20 на місяць за 4500 запитів кожні 5 годин.

  • Max: $50 на місяць за 15000 запитів кожні 5 годин.

Ціни місячного Плану Токенів для високої швидкості: Для робочих навантажень виробничого масштабу, що вимагають варіанту M2.7-highspeed, доступні наступні рівні:

  • Plus-Highspeed: $40 на місяць за 4500 запитів кожні 5 годин.

  • Max-Highspeed: $80 на місяць за 15000 запитів кожні 5 годин.

  • Ultra-High-Speed: $150 на місяць за 30000 запитів кожні 5 годин.

Ціни річного Плану Токенів: Річні підписки надають значні знижки за довгострокову співпрацю:

  • Standard Starter: $100 на рік (економія $20).

  • Standard Plus: $200 на рік (економія $40).

  • Standard Max: $500 на рік (економія $100).

  • High-Speed Plus: $400 на рік (економія $80).

  • High-Speed Max: $800 на рік (економія $160).

  • High-Speed Ultra: $1500 на рік (економія $300).

Один запит у цих планах приблизно дорівнює одному виклику MiniMax M2.7, хоча інші моделі в пакеті, такі як відео або високоякісна мова, споживають запити за вищою ставкою.

Офісні інтеграції інструментів

Для забезпечення безперешкодного впровадження MiniMax надала офіційну документацію для інтеграції M2.7 у понад 11 основних інструментів розробника та платформ агентів.

Це включає такі широко використовувані платформи, як Claude Code, Cursor, Trae та Zed. Серед інших офіційно підтримуваних інструментів – OpenCode, Kilo Code, Cline, Roo Code, Droid, Grok CLI та Codex CLI.

Крім того, модель підтримує протокол Model Context Protocol, що дозволяє їй нативно використовувати такі інструменти, як Web Search та Understand Image для мультимодальних міркувань. Розробники, які використовують SDK від Anthropic, можуть легко інтегрувати M2.7, змінивши ANTHROPIC_BASE_URL для вказівки на кінцеву точку MiniMax. При використанні MiniMax як провайдера в таких інструментах, як OpenClaw, можливості розуміння зображень автоматично налаштовуються через кінцеву точку VLM API моделі, не вимагаючи додаткових налаштувань від користувача.

Завдяки широкому спектру інтеграцій та піонерському підходу до рекурсивного самовдосконалення, MiniMax M2.7 представляє собою значний крок до майбутнього, де моделі ШІ так само беруть участь у власному прогресі, як і люди, що їх спрямовують.

Стратегічні наслідки для корпоративних осіб, що приймають рішення

Технічні керівники повинні розглядати випуск M2.7 як свідчення того, що агентний ШІ перейшов від теоретичного прототипування до готового до виробництва інструментарію. Здатність моделі скорочувати час відновлення для активних виробничих інцидентів до менш ніж трьох хвилин шляхом автономного корелювання метрик моніторингу з репозиторіями коду передбачає зміну парадигми для команд SRE та DevOps.

Підприємства, які зараз відчувають тиск щодо впровадження ефективності на основі ШІ, повинні вирішити, чи задовольняє їх ШІ як досвідчений помічник, чи вони готові інтегрувати нативні команди агентів, здатних до повної реалізації проєкту “під ключ”.

З фінансової точки зору, M2.7 є значним досягненням у сфері економічної ефективності для висококласних міркувань. Аналіз показує, що експлуатація M2.7 коштує менше ніж третину вартості експлуатації GLM-5 при еквівалентних рівнях інтелекту. Наприклад, досягнення стандартного індексу інтелекту коштувало 176 доларів на M2.7 порівняно з 547 доларами для GLM-5 та 371 доларом для Kimi K2.5. Ця агресивна цінова стратегія ставить M2.7 на Парето-фронт діаграми “інтелект проти вартості”, пропонуючи корпоративний рівень міркувань за частку ринкової ціни.

Нинішній ринок насичений високопродуктивними моделями, багато з яких все ще мають невелику перевагу в загальних показниках міркувань. Однак специфічна оптимізація M2.7 для роботи з офісними пакетами (Excel, PPT, Word) та її висока продуктивність на бенчмарку GDPval-AA роблять її основним кандидатом для організацій, що зосереджені на професійних робочих процесах з документами та фінансовому моделюванні.

Особам, що приймають рішення, необхідно зважити переваги універсальної передової моделі проти спеціалізованого інструменту, як M2.7, яка розроблена для взаємодії зі складними внутрішніми структурами та інструментаріями.

Зрештою, той факт, що модель розроблена китайською компанією (зі штаб-квартирою в Шанхаї) та підпадає під закони цієї країни, а також закони країни користувача, і ще не доступна для офлайн-використання, може стати серйозним викликом для підприємств, що працюють у США та на Заході – особливо тих, хто працює у високорегульованих галузях або має справи з державними установами.

Тим не менш, перехід до самовдосконалюваних моделей свідчить про те, що рентабельність інвестицій в ШІ все більше залежатиме від рекурсивних переваг самої системи. Організації, які впроваджують моделі, здатні покращувати власні інструментарії, можуть виявитися на швидшій ітераційній кривій, ніж ті, що покладаються на статичне, виключно людське вдосконалення. З агресивною інтеграцією MiniMax у сучасний стек розробника, бар’єр для тестування цих автономних робочих процесів значно знизився, створюючи тиск на конкурентів, щоб вони також запропонували подібні нативні можливості агентів.

Прогноз ІТ-Блогу: MiniMax M2.7, завдяки своїй здатності до самовдосконалення та вражаючій економічній ефективності, ймовірно, стимулюватиме нову хвилю інновацій у галузі ШІ-агентів. Очікується, що найближчим часом ми побачимо появу більш спеціалізованих версій моделі, оптимізованих для конкретних галузей, а також посилення конкуренції з боку інших розробників, які намагатимуться відтворити цю унікальну функціональність.

За матеріалами: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *