z.ai презентує потужний GLM-5 Turbo: швидший, дешевший, але не відкритий

Китайський стартап Z.ai, відомий своїми потужними мовними моделями з відкритим кодом сімейства GLM, представив GLM-5-Turbo – новий пропрієтарний варіант моделі GLM-5, призначений для робочих процесів, керованих агентами. Компанія позиціонує його як швидшу модель, оптимізовану для завдань типу OpenClaw, таких як використання інструментів, довголанцюгове виконання та постійна автоматизація. GLM-5-Turbo вже доступна через API Z.ai на платформі стороннього постачальника OpenRouter. Вона має контекстне вікно приблизно на 202.8 тис. токенів, максимальний вивід 131.1 тис. токенів, а вартість становить $0.96 за мільйон вхідних токенів і $3.20 за мільйон вихідних токенів. Це приблизно на $0.04 дешевше за загальну вартість введення та виведення (на 1 мільйон токенів) порівняно з попередньою версією, за нашими розрахунками. | Модель | Введення | Виведення | Загальна вартість | Джерело | | :————— | :——- | :——– | :—————- | :———– | | Grok 4.1 Fast | $0.20 | $0.50 | $0.70 | xAI | | Gemini 3 Flash | $0.50 | $3.00 | $3.50 | Google | | Kimi-K2.5 | $0.60 | $3.00 | $3.60 | Moonshot | | **GLM-5-Turbo** | **$0.96**| **$3.20** | **$4.16** | **OpenRouter**| | GLM-5 | $1.00 | $3.20 | $4.20 | Z.ai | | Claude Haiku 4.5 | $1.00 | $5.00 | $6.00 | Anthropic | | Qwen3-Max | $1.20 | $6.00 | $7.20 | Alibaba Cloud| | Gemini 3 Pro | $2.00 | $12.00 | $14.00 | Google | | GPT-5.2 | $1.75 | $14.00 | $15.75 | OpenAI | | GPT-5.4 | $2.50 | $15.00 | $17.50 | OpenAI | | Claude Sonnet 4.5| $3.00 | $15.00 | $18.00 | Anthropic | | Claude Opus 4.6 | $5.00 | $25.00 | $30.00 | Anthropic | | GPT-5.4 Pro | $30.00 | $180.00 | $210.00 | OpenAI | Крім того, Z.ai інтегрує GLM-5-Turbo у свій продукт GLM Coding – пакет послуг кодувального асистента, який має три рівні: Lite ($27/квартал), Pro ($81/квартал) та Max ($216/квартал). Згідно з повідомленням Z.ai від 15 березня, передплатники Pro отримають доступ до GLM-5-Turbo вже в березні, тоді як передплатники Lite, які користуються базовою GLM-5, отримають Turbo лише в квітні. Компанія також приймає заявки на ранній доступ для корпоративних клієнтів через Google Форму, що свідчить про можливість дострокового доступу для певних користувачів залежно від наявних потужностей. Z.ai описує GLM-5-Turbo як модель, розроблену для “швидкого інференсу” та “глибокої оптимізації для реальних агентських робочих процесів, що передбачають довгі ланцюжки виконання”. Вона демонструє покращення у складному розкладанні інструкцій, використанні інструментів, запланованому та постійному виконанні, а також стабільності під час тривалих завдань. Цей реліз надає розробникам новий інструмент для створення автономних ШІ-агентів на кшталт OpenClaw і сигналізує про напрямок, у якому рухаються постачальники моделей: від інтерфейсів чату до систем, здатних надійно виконувати багатоетапні завдання. Саме сюди прямує конкуренція, особливо серед компаній, що прагнуть залучити розробників та корпоративні команди, які створюють внутрішні асистенти, оркестратори робочих процесів та кодувальні агенти.

Створена для виконання, а не лише для розмов

Матеріали Z.ai позиціонують GLM-5-Turbo як модель для реалістичної поведінки агентів, а не для статичного використання з інтерпретацією “запит-відповідь”. Основний акцент робиться на надійності в практичних потоках завдань: кращому дотриманні команд, більш ефективному виклику інструментів, покращеній обробці запланованих і постійних завдань, а також швидшому виконанні складних логічних ланцюжків. Таке позиціонування виводить модель на ринок агентів, які роблять більше, ніж просто відповідають на запитання. Вона призначена для систем, які можуть збирати інформацію, викликати інструменти, розбивати інструкції та продовжувати роботу над складними послідовностями завдань з мінімальним наглядом. GLM-5-Turbo, схоже, є не просто прямою наступницею GLM-5, а більш спеціалізованим варіантом, орієнтованим на виконання: оптимізованим для швидкості, використання інструментів та стабільності агентів у довгих ланцюжках. Базова GLM-5 залишається флагманською моделлю Z.ai з відкритим кодом для ширшого застосування. GLM-5-Turbo виглядає особливо конкурентоспроможною в сценаріях OpenClaw, таких як пошук та збір інформації, офісні та повсякденні завдання, аналіз даних, розробка та операційна діяльність, а також автоматизація. Це матеріали, надані компанією, а не незалежна валідація, але вони чітко визначають призначене позиціонування продукту.

Передісторія: Z.ai та GLM-5 підготували ґрунт для Turbo

Заснована у 2019 році як стартап Університету Цінхуа в Пекіні, Z.ai (раніше Zhipu AI) наразі є однією з найвідоміших китайських компаній-розробників фундаментальних моделей. Штаб-квартира компанії залишається в Пекіні, а її очолює генеральний директор Чжан Пень. Z.ai вийшла на біржу в Гонконзі 8 січня 2026 року з ціною акцій 116.20 гонконгських доларів, розпочавши торги на рівні 120 гонконгських доларів. Заявлена ринкова капіталізація становить 52.83 мільярда гонконгських доларів, що робить її найбільшим незалежним розробником великих мовних моделей у Китаї. Станом на 30 вересня 2025 року моделями компанії скористалися понад 12 000 корпоративних клієнтів, понад 80 мільйонів кінцевих пристроїв та понад 45 мільйонів розробників по всьому світу. Остання значна розробка Z.ai, GLM-5, представлена в лютому 2026 року, надає корисний контекст для розуміння того, що компанія намагається зробити з GLM-5-Turbo. GLM-5 – це флагманська модель з відкритим кодом під ліцензією MIT, яка продемонструвала рекордно низький показник “галюцинацій” за індексом AA-Omniscience. Вона також мала вбудований “Агентний режим”, здатний перетворювати запити або вихідні матеріали на готові до використання файли .docx, .pdf та .xlsx. Цей реліз також позиціонувався як значний технічний стрибок для компанії. GLM-5 масштабувалася до 744 мільярдів параметрів з 40 мільярдами активних на токен у архітектурі “суміш експертів”, використовувала 28.5 трильйонів токенів попереднього тренування та спиралася на нову асинхронну інфраструктуру навчання з підкріпленням під назвою “slime” для зменшення вузьких місць у навчанні та підтримки більш складної агентської поведінки. У цьому світлі GLM-5-Turbo виглядає не стільки заміною GLM-5, скільки більш вузькоспеціалізованим комерційним відгалуженням: варіантом, що зберігає великий контекст і агентну спрямованість флагманської лінійки, але наголошує на швидкості, стабільності та виконанні в реальних агентських ланцюжках.

Функції для розробників та пакування моделей

З технічного боку, Z.ai пакує сімейство GLM-5 з функціями, які розробники зараз очікують від серйозних моделей, орієнтованих на агентів, включаючи обробку великого контексту, інструменти, підтримку міркувань та структуровані інтеграції. Сторінка GLM-5-Turbo на OpenRouter вказує на підтримку інструментів, вибору інструментів та форматування відповідей, а також надає дані про продуктивність у реальному часі, включно із середньою пропускною здатністю та затримкою. Телеметрія постачальника OpenRouter додає корисне порівняння продуктивності GLM-5 та GLM-5-Turbo на рівні розгортання, хоча дані не зовсім тотожні, оскільки GLM-5 представлена через кількох постачальників, тоді як GLM-5-Turbo відображається лише через Z.ai. За пропускною здатністю GLM-5-Turbo в середньому становить 48 токенів за секунду на OpenRouter, що нижче найшвидших кінцевих точок GLM-5, показаних на скріншотах (Fireworks – 70 токенів/сек, Friendli – 58 токенів/сек), але вище, ніж у Together (40 токенів/сек). За сирою затримкою першого токена GLM-5-Turbo повільніша з наявних даних, показуючи 2.92 секунди порівняно з 0.41 секунди для кінцевої точки GLM-5 від Friendli, 1.00 секунди для Parasail та 1.08 секунди для DeepInfra. Однак картина покращується за загальним часом завершення: GLM-5-Turbo показує 8.16 секунди, що швидше за кінцеві точки GLM-5, які варіюються від 9.34 секунди на Fireworks до 11.23 секунди на DeepInfra. Найбільш помітною операційною перевагою є надійність інструментів. GLM-5-Turbo демонструє показник помилок виклику інструментів 0.67%, що суттєво нижче, ніж у постачальників GLM-5, де показники помилок коливаються від 2.33% до 6.41%. Для корпоративних команд це означає модель, яка може не вигравати за початковою швидкістю відгуку у поточному маршрутизуванні OpenRouter, але може бути краще пристосованою для довших запусків агентів, де стабільність завершення та менша кількість збоїв інструментів мають більше значення, ніж найшвидший перший токен.

Тестування та ціноутворення

z.ai презентує потужний GLM-5 Turbo: швидший, дешевший, але не відкритий 1

Радарна діаграма ZClawBench, опублікована Z.ai, показує, що GLM-5-Turbo особливо конкурентоспроможна в сценаріях OpenClaw, таких як пошук та збір інформації, офісні та повсякденні завдання, аналіз даних, розробка та операційна діяльність, а також автоматизація. Це візуалізації бенчмарків, надані компанією, а не незалежна валідація, але вони допомагають пояснити, як Z.ai хоче, щоб обидві моделі сприймалися: GLM-5 як ширший відкритий флагман для кодування, а Turbo – як більш цільовий варіант для виконання агентських завдань.

Більш нюансований сигнал щодо ліцензування

Одним із примітних моментів є ліцензування. Z.ai стверджує, що GLM-5-Turbo наразі є закритою моделлю, але також зазначає, що можливості та результати роботи цієї моделі будуть включені до її наступної моделі з відкритим кодом. Це важлива відмінність. Компанія не дає чіткої обіцянки відкрити саму GLM-5-Turbo. Натомість вона повідомляє, що уроки, техніки та вдосконалення з цього релізу ляжуть в основу майбутньої відкритої моделі. Це робить запуск більш нюансованим, ніж повний відхід від відкритості. Попередня стратегія Z.ai щодо GLM значною мірою спиралася на відкриті релізи та розповсюдження відкритих ваг, що допомогло їй здобути впізнаваність серед розробників.

Китайський ринок ШІ може переорієнтовуватися з відкритого коду

Ліцензійна політика GLM-5-Turbo також вписується в ширший контекст китайського ринку, що робить запуск більш помітним, ніж просте оновлення продукту. Останніми тижнями звіти щодо підрозділу Qwen від Alibaba викликали нові питання щодо того, як провідні китайські лабораторії ШІ будуть балансувати відкриті релізи з комерційним тиском. На початку місяця керівник підрозділу Qwen Лінь Цзюньян залишив свою посаду, ставши третім високопоставленим керівником Qwen, який пішов у 2026 році, незважаючи на те, що сімейство Qwen від Alibaba залишається одним із найактивніших зусиль у сфері відкритих моделей, випустивши понад 400 моделей з відкритим кодом з 2023 року та маючи понад 1 мільярд завантажень. Потім Reuters повідомила 16 березня, що генеральний директор Alibaba Едді Ву візьме на себе пряме керівництво новоствореною бізнес-групою, орієнтованою на ШІ, яка об’єднає Qwen та інші підрозділи, на тлі перевірки стратегії, прибутковості та жорсткої цінової конкуренції навколо пропозицій відкритих моделей у Китаї. Навіть не перебільшуючи ці події, вони допомагають сформулювати ширше питання, яке висить над сектором: чи економіка передових ШІ починає підштовхувати навіть історично відкриті китайські лабораторії до більш сегментованої стратегії. Це не означає, що китайські лабораторії відмовляються від відкритого коду. Але закономірність стає важче ігнорувати: відкриті моделі допомагають стимулювати впровадження, лояльність розробників та охоплення екосистеми, тоді як певні високоцінні варіанти, призначені для корпоративних агентів, кодувальних робочих процесів та інших комерційно привабливих випадків використання, можуть все частіше з’являтися спочатку як пропрієтарні продукти. У цьому сенсі GLM-5-Turbo відповідає ширшому можливому зсуву на китайському ринку ШІ, який все більше нагадує стратегію, що використовується OpenAI, Anthropic та Google у США: відкритість як дистрибуція, пропрієтарні системи як бізнес. Розглядаючи це з такої точки зору, GLM-5-Turbo виглядає не просто як оновлення продукту, орієнтоване на швидкість. Це може бути ще одним знаком того, що частини китайського ШІ-сектору рухаються до тієї ж гібридної моделі, яка вже поширена в США: відкритість як дистрибуція, пропрієтарні системи як бізнес. Це не означатиме кінець відкритого ШІ від китайських лабораторій, але це може означати, що їхні найбільш стратегічно важливі пропозиції, орієнтовані на агентів, спочатку з’являтимуться за закритим доступом, навіть якщо деякі з їхніх базових досягнень згодом потраплять у відкриті релізи. Для розробників, які оцінюють агентні платформи, це робить GLM-5-Turbo одночасно продуктом та корисним сигналом. Z.ai все ще говорить мовою відкритих моделей. Але цим релізом вона також демонструє, що деякі з її найбільш комерційно значущих робіт можуть спочатку з’являтися як пропрієтарна інфраструктура для корпоративних агентних систем.

Прогноз ІТ-Блогу: GLM-5-Turbo, ймовірно, стимулюватиме подальшу спеціалізацію мовних моделей для конкретних агентських завдань, де вартість, швидкість виконання та надійність інтеграції інструментів є критичними. Очікується, що конкуренція в цьому сегменті посилиться, спонукаючи до появи нових рішень, що оптимізують складні робочі процеси за допомогою ШІ.

За даними порталу: venturebeat.com