GLM-5.2 від Z.ai перевершує GPT-5.5 у кодуванні та коштує вшестеро менше

Китайський стартап Z.ai (раніше Zhipu AI) анонсував негайний випуск GLM-5.2, великої мовної моделі (LLM) з відкритими вагами, що містить 753 мільярди параметрів. Ця модель спеціально розроблена для домінування в автономному кодуванні та інженерних завданнях, що вимагають “довгого горизонту” виконання. Модель доступна одразу на Hugging Face, через API Z.ai та в понад 20 сторонніх середовищах для кодування. Вона може похвалитися надзвичайно стабільним контекстним вікном обсягом 1 мільйон токенів, а корпоративні тарифні плани починаються від $12.60 на місяць. Для компаній, що цінують витрати та безпеку, Z.ai випустила основні ваги GLM-5.2 під неліцензованою ліцензією MIT. Це дозволяє підприємствам безкоштовно завантажувати модель з Hugging Face, налаштовувати її під власні потреби та запускати локально або на віртуальних машинах, сплачуючи лише вартість обчислювальних потужностей та електроенергії. Це стає все більш привабливим варіантом для корпорацій, оскільки найсучасніші американські пропрієтарні моделі стикаються з невизначеним регуляторним майбутнім. Нагадаємо, минулого тижня адміністрація Трампа видала директиву про експортний контроль, що забороняє іноземцям використовувати нову модель Claude Fable 5 від Anthropic (у відповідь компанія тимчасово офлайнила згадані моделі для всіх користувачів). Для технічних директорів підприємств GLM-5.2 від Z.ai надає потужний інструмент для локального розміщення передових ШІ-технологій, повністю оминаючи географічні та комерційні обмеження.

IndexShare: Ефективне використання індексаторів для зменшення обчислювальних потреб

GLM-5.2 працює на 753 мільярдах параметрів і включає значну архітектурну оптимізацію під назвою “IndexShare”. У стандартних великих мовних моделях перерахунок механізмів уваги на довгих документах є обчислювально затратним. IndexShare вирішує цю проблему, повторно використовуючи однаковий індексатор для кожних чотирьох розріджених шарів уваги. При максимальній довжині контексту в 1 мільйон токенів це нововведення скорочує обчислювальні операції з плаваючою комою на токен у 2.9 рази. Модель також оснащена оновленим шаром Multi-Token Prediction (MTP) для спекулятивного декодування, що збільшує довжину прийнятих токенів до 20% під час виведення. Крім того, Z.ai впровадила гнучкі, вибіркові “Режими Мислення”. Користувачі можуть перемикати рівень логічного зусилля моделі між “Макс” (для максимального розв’язання складних завдань) та “Високий” (для балансу між високою продуктивністю та швидкістю обробки).

Найсучасніші бенчмарки для відкритої моделі, що відповідають і навіть перевершують комерційних лідерів

На галузевих стандартних сторонніх тестах GLM-5.2 демонструє кращі результати, ніж більшість моделей з відкритим вихідним кодом, таких як DeepSeek v4, і наближається або перевищує показники закритих моделей, таких як GPT-5.5 від OpenAI та Claude Opus 4.8 від Anthropic.

GLM-5.2 від Z.ai перевершує GPT-5.5 у кодуванні та коштує вшестеро менше 1

Модель особливо виділяється у використанні інструментів агентами та в завданнях інженерії програмного забезпечення з довгим горизонтом:

  • SWE-bench Pro: GLM-5.2 набрала 62.1 бала, впевнено обійшовши GPT-5.5 (58.6) та свого попередника GLM-5.1 (58.4).

  • FrontierSWE (Домінування): Розроблена для тестування виконання завдань з довгим горизонтом, GLM-5.2 показала 74.4%, перевершивши GPT-5.5 (72.6%) та майже зрівнявшись із Claude Opus 4.8 (75.1%).

GLM-5.2 від Z.ai перевершує GPT-5.5 у кодуванні та коштує вшестеро менше 2
  • MCP-Atlas: У цьому тестуванні використання інструментів GLM-5.2 досягла 77.0, випередивши GPT-5.5 (75.3) і трохи поступившись Claude Opus 4.8 (77.8).

  • Humanity’s Last Exam (з інструментами): Оснащена зовнішніми інструментами, GLM-5.2 досягла результату 54.7, випередивши GPT-5.5 (52.2) і залишившись трохи позаду Claude Opus 4.8 (57.9).

  • PostTrainBench & SWE-Marathon: У тривалих інженерних завданнях, що тривають кілька годин, GLM-5.2 послідовно перевершувала GPT-5.5, набравши 34.3% проти 25.0% у GPT-5.5 на PostTrainBench та 13.0% проти 12.0% на SWE-Marathon.

Хоча GLM-5.2 трохи відстає від Claude Opus 4.8 і GPT-5.5 за сирими показниками Terminal-Bench 2.1 (81.0 проти 85.0 та 84.0 відповідно), вона значно перевершує Gemini 3.1 Pro від Google (74.0). Окрім традиційних метрик кодування, GLM-5.2 зайняла вражаюче перше місце в бенчмарку краудсорсингових завдань проєктування Design Arena, обійшовши навіть Claude Fable 5 з ELO-рейтингом 1360. Крім того, вплив нових вибіркових “режимів мислення” від Z.ai чітко видно в даних: у режимі “Макс” GLM-5.2 досягає пікової продуктивності, але використовує майже 85 тисяч вихідних токенів на завдання. Перехід до режиму “Високий” призводить до втрати лише кількох пунктів у продуктивності, одночасно фактично скорочуючи необхідний вивід токенів удвічі, що забезпечує важливий важіль оптимізації для застосунків, чутливих до затримок.

Доступ через плани кодування та API

Для операціоналізації моделі Z.ai запустила GLM Coding Plan, орієнтований на робочі процеси розробників, а не на прості чат-інтерфейси. План пропонує готову підтримку сторонніх американських та світових інструментів і фреймворків для агентного кодування, включаючи Claude Code, OpenClaw, Cline, Kilo Code, Crush та Factory. Цінові плани Coding Plan (при щорічній оплаті) є надзвичайно конкурентоспроможними:

  • Lite: $12.60 на місяць ($151.20 на рік, починаючи з другого року), призначений для легких ітерацій над невеликими репозиторіями.

  • Pro: $50.40 на місяць для щоденної розробки над репозиторіями середнього розміру, пропонуючи в 5 разів більший ліміт використання, ніж план Lite.

  • Max: $112.00 на місяць для інтенсивних навантажень, пропонуючи в 20 разів більший ліміт використання, ніж Lite, та виділені ресурси в години пік.

Для розробників підприємств, що інтегрують сиру модель у власні додатки, ціни API від Z.ai значно нижчі за західних конкурентів, при цьому зберігаючи точні ставки попереднього покоління GLM-5.1. Доступ до API GLM-5.2 коштує $1.40 за мільйон вхідних токенів та $4.40 за мільйон вихідних токенів, що робить її моделлю середнього цінового діапазону на світовому ринку. Огляд цін API моделей Frontier від VentureBeat Відсортовано за загальною вартістю (вхідні + вихідні) від найменш до найбільш дорогої. Ціни вказані за стандартними тарифами за використання за 1 мільйон токенів.

Модель

Вхідні

Вихідні

Загальна вартість

Джерело

MiMo-V2.5 Flash

$0.10

$0.30

$0.40

Xiaomi MiMo

deepseek-v4-flash

$0.14

$0.28

$0.42

DeepSeek

deepseek-v4-pro

$0.435

$0.87

$1.305

DeepSeek

MiniMax-M3

$0.30

$1.20

$1.50

MiniMax

Gemini 3.1 Flash-Lite

$0.25

$1.50

$1.75

Google

Qwen3.7-Plus

$0.40

$1.60

$2.00

Alibaba Cloud

MiMo-V2.5

$0.40

$2.00

$2.40

Xiaomi MiMo

Grok 4.3 (low context)

$1.25

$2.50

$3.75

xAI

MiMo-V2.5 Pro (≤256K)

$1.00

$3.00

$4.00

Xiaomi MiMo

Kimi-K2.6

$0.95

$4.00

$4.95

Moonshot/Kimi

GLM-5.2

$1.40

$4.40

$5.80

Z.ai

Grok 4.3 (high context)

$2.50

$5.00

$7.50

xAI

MiMo-V2.5 Pro (>256K)

$2.00

$6.00

$8.00

Xiaomi MiMo

Qwen3.7-Max

$2.50

$7.50

$10.00

Alibaba Cloud

Gemini 3.5 Flash

$1.50

$9.00

$10.50

Google

Gemini 3.1 Pro Preview (≤200K)

$2.00

$12.00

$14.00

Google

GPT-5.4

$2.50

$15.00

$17.50

OpenAI

Gemini 3.1 Pro Preview (>200K)

$4.00

$18.00

$22.00

Google

Claude Opus 4.8

$5.00

$25.00

$30.00

Anthropic

GPT-5.5

$5.00

$30.00

$35.00

OpenAI

Claude Fable 5 / Claude Mythos 5

$10.00

$50.00

$60.00

Anthropic

Для подальшої оптимізації витрат на робочі навантаження з великим контекстом Z.ai пропонує кешовану вхідну ставку всього $0.26 за мільйон токенів, а також обмежену за часом пропозицію безкоштовного зберігання кешованих вхідних даних. Яскравий контраст між розробниками відкритих моделей та комерційними західними лабораторіями не залишився непоміченим спільнотою розробників. У X популярний спостерігач за ШІ Lisan al Gaib (@scaling01) стверджував, що “лабораторії Frontier абсолютно обманюють вас щодо цін на API”. У дописі зазначалося, що хоча великі відкриті моделі, такі як GLM-5.2 з 744 мільярдами параметрів, коштують $4.40 за мільйон вихідних токенів, а DeepSeek-V4-Pro (1.6 трильйона параметрів) – лише $0.87, комерційні моделі вимагають значних премій: Anthropic’s Sonnet 4.6 та Opus 4.8 коштують $15.00 та $25.00 відповідно, тоді як GPT-5.5 від OpenAI коштує $30.00 за вихідні дані. Підкреслюючи, що розробники відкритих моделей працюють прибутково, не покладаючись на новітні “круті чипи Blackwell”, коментатор припустив, що провідні комерційні лабораторії “ймовірно, мають маржу понад 90%”.

Переваги невимодифікованої ліцензії MIT для корпоративного використання

Найбільш руйнівним аспектом випуску GLM-5.2 є її ліцензування. Z.ai випустила ваги моделі під відкритою ліцензією MIT, що робить її системою “Pure Open”. Технічна документація компанії чітко зазначає, що ця ліцензія гарантує “відсутність регіональних обмежень” та дозволяє “технічний доступ без кордонів”. Для керівників підприємств, які займаються технологіями, ліцензія MIT означає, що програмне забезпечення може використовуватися, модифікуватися та комерціалізуватися без сплати роялті або дотримання обмежувальних політик управління “прийнятного використання”, поширених для ліцензій подвійного призначення. Це дозволяє інженерним командам розміщувати передові ШІ на власній суверенній інфраструктурі, повністю усуваючи залежність від постачальника.

Теплий прийом серед розробників ШІ та творців інструментів

Реакція розробників на реліз була негайною та переважно позитивною. Команда Kilo Code підтвердила інтеграцію першого дня, заявивши в X: “GLM-5.2 працює в Kilo Code з першого дня. Контекстне вікно 1M і режим Max увімкнені. Налаштуйте конфігурацію та вперед!”. Open-source середовище кодування Cline IDE підтримало це в X, зазначивши економічну перевагу: “GLM-5.2 – перша модель з відкритими вагами, яка подолала 80% на Terminal-Bench, і перевершує всі інші доступні відкриті моделі. Вона також перевершує Gemini, роблячи її моделлю фронтиру за частку від вартості. Відкриті ваги повертаються. Ця модель змінює правила гри. Доступна в Cline зараз!”. Аналогічно, конкурентний open-source агент для кодування Eigent AI також протестував нові можливості моделі в складних агентних робочих процесах, зазначивши в X: “дали реальне завдання з довгим горизонтом: дослідити 30 компаній у 6 секторах стеку інфраструктури ШІ, структурувати їх у JSON, а потім створити інтерактивний HTML-звіт… де 5.2 виривається вперед: -> планування…”.

Прогноз ІТ-Блогу: Випуск GLM-5.2 з відкритими вагами та значними оптимізаціями обчислювальної потужності, ймовірно, спровокує нову хвилю інновацій у сфері рішень для локального розгортання ШІ. Компанії, що раніше залежали від дорогих комерційних API, тепер матимуть доступний та потужний варіант, що стимулюватиме конкуренцію та потенційно знизить ціни в усій галузі.

За матеріалами: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *