z.ai здобуває новий рекорд: GLM-5 з мінімальними галюцинаціями завдяки інноваційній RL-техніці ‘slime’

z.ai здобуває новий рекорд: GLM-5 з мінімальними галюцинаціями завдяки інноваційній RL-техніці 'slime' 1

Китайський стартап у сфері штучного інтелекту Zhupai, також відомий як z.ai, цього тижня представив нову потужну великомасштабну мовну модель (LLM) — GLM-5.

Це останнє доповнення до вражаючої серії GLM від z.ai, яка зберігає ліцензію MIT для відкритих вихідних кодів, що робить її ідеальною для корпоративного використання. Серед інших визначних досягнень, GLM-5 продемонструвала найнижчий показник галюцинацій за незалежним індексом Artificial Analysis Intelligence Index v4.0.

Зі skorom -1 за індексом AA-Omniscience, що означає значне покращення на 35 пунктів порівняно з попередньою версією, GLM-5 тепер лідирує в усій галузі ШІ, випереджаючи американських конкурентів, таких як Google, OpenAI та Anthropic, за надійністю знань. Вона вміє відмовлятися надавати інформацію, коли не впевнена, замість того, щоб вигадувати її.

z.ai здобуває новий рекорд: GLM-5 з мінімальними галюцинаціями завдяки інноваційній RL-техніці 'slime' 2

Окрім своєї здатності до міркувань, GLM-5 розроблена для високопродуктивної роботи зі знаннями. Вона має вбудовані можливості “Режиму Агента”, які дозволяють перетворювати сирі запити або вихідні матеріали безпосередньо на професійні офісні документи, зокрема готові до використання файли у форматах .docx, .pdf та .xlsx.

Чи то створення детальних фінансових звітів, пропозицій спонсорства для шкіл, чи складних електронних таблиць, GLM-5 надає результати у реальних форматах, які інтегруються безпосередньо в корпоративні робочі процеси.

Вона також має революційну ціну: приблизно 0,80 долара США за мільйон вхідних токенів та 2,56 долара США за мільйон вихідних токенів. Це приблизно в 6 разів дешевше, ніж у пропрієтарних конкурентів, таких як Claude Opus 4.6, роблячи передову агентну розробку більш економічно вигідною, ніж будь-коли раніше. Ось що ще слід знати керівникам підприємств про модель та її навчання.

Технологія: масштабування для агентної ефективності

В основі GLM-5 лежить значний стрибок у кількості параметрів. Модель розширюється з 355 мільярдів параметрів GLM-4.5 до вражаючих 744 мільярдів параметрів, з 40 мільярдами активних на токен у її архітектурі “Суміш експертів” (MoE). Це зростання підтримується збільшенням обсягу даних попереднього навчання до 28,5 трильйонів токенів.

Щоб вирішити проблему неефективності навчання в такому масштабі, Zai розробила “slime” – нову асинхронну інфраструктуру навчання з підкріпленням (RL).

Традиційні методи RL часто страждають від “вузьких місць довгого хвоста”; Slime усуває цю проблему, дозволяючи траєкторіям генеруватися незалежно, що забезпечує тонку ітерацію, необхідну для складних агентних дій.

Інтегруючи системні оптимізації, такі як Active Partial Rollouts (APRIL), slime усуває вузькі місця генерації, які зазвичай споживають понад 90% часу навчання RL, значно прискорюючи цикл ітерацій для складних агентних завдань.

Структура фреймворку зосереджена на тричастинній модульній системі: високопродуктивний модуль навчання на базі Megatron-LM, модуль викатки, що використовує SGLang та кастомні маршрутизатори для високошвидкісної генерації даних, та централізований буфер даних, який керує початковою ініціалізацією промптів та зберіганням результатів викатки.

Забезпечуючи адаптивні верифіковані середовища та петлі зворотного зв’язку компіляції з багатьма поворотами, slime надає надійну, високопродуктивну основу, необхідну для переходу ШІ від простих діалогових взаємодій до суворого системного інжинірингу з тривалим горизонтом.

Щоб спростити розгортання, GLM-5 інтегрує DeepSeek Sparse Attention (DSA), зберігаючи ємність контексту 200 тисяч токенів, одночасно значно зменшуючи витрати.

Наскрізна робота зі знаннями

Zai позиціонує GLM-5 як “офісний” інструмент ери AGI. Якщо попередні моделі зосереджувалися на фрагментах, GLM-5 створена для надання готових документів.

Вона може автономно трансформувати промпти у форматовані файли .docx, .pdf та .xlsx – від фінансових звітів до спонсорських пропозицій.

На практиці це означає, що модель може розкладати високорівневі цілі на дієві підзавдання та виконувати “Агентний інжиніринг”, де люди визначають контрольні точки якості, а ШІ виконує завдання.

Висока продуктивність

Згідно з Artificial Analysis, бенчмарки GLM-5 роблять її найпотужнішою відкритою моделлю у світі, випереджаючи китайського конкурента Moonshot з його новою Kimi K2.5, випущеною лише два тижні тому. Це свідчить про те, що китайські компанії, що займаються розробкою ШІ, майже наздогнали значно краще забезпечених західних пропрієтарних конкурентів.

Згідно з власними матеріалами z.ai, опублікованими сьогодні, GLM-5 посідає близькі до передових позиції за низкою ключових показників:

SWE-bench Verified: GLM-5 досягла результату 77,8, випередивши Gemini 3 Pro (76,2) і наблизившись до Claude Opus 4.6 (80,9).

Vending Bench 2: У симуляції ведення бізнесу GLM-5 зайняла 1-ше місце серед відкритих моделей з кінцевим балансом 4 432,12 долари США.

z.ai здобуває новий рекорд: GLM-5 з мінімальними галюцинаціями завдяки інноваційній RL-техніці 'slime' 3

Крім продуктивності, GLM-5 агресивно демпінгує на ринку. Доступна на OpenRouter з 11 лютого 2026 року, вона коштує приблизно від 0,80 до 1,00 долара США за мільйон вхідних токенів та від 2,56 до 3,20 долара США за мільйон вихідних токенів. Це відповідає середньому діапазону порівняно з іншими провідними LLM, але, враховуючи її найвищу в бенчмарках продуктивність, це можна назвати “вигідною угодою”.

Модель

Вхід (за 1 млн токенів)

Вихід (за 1 млн токенів)

Загальна вартість (1 млн вх. + 1 млн вих.)

Джерело

Qwen 3 Turbo

0,05 дол. США

0,20 дол. США

0,25 дол. США

Alibaba Cloud

Grok 4.1 Fast (міркування)

0,20 дол. США

0,50 дол. США

0,70 дол. США

xAI

Grok 4.1 Fast (не міркування)

0,20 дол. США

0,50 дол. США

0,70 дол. США

xAI

deepseek-chat (V3.2-Exp)

0,28 дол. США

0,42 дол. США

0,70 дол. США

DeepSeek

deepseek-reasoner (V3.2-Exp)

0,28 дол. США

0,42 дол. США

0,70 дол. США

DeepSeek

Gemini 3 Flash Preview

0,50 дол. США

3,00 дол. США

3,50 дол. США

Google

Kimi-k2.5

0,60 дол. США

3,00 дол. США

3,60 дол. США

Moonshot

GLM-5

1,00 дол. США

3,20 дол. США

4,20 дол. США

Z.ai

ERNIE 5.0

0,85 дол. США

3,40 дол. США

4,25 дол. США

Qianfan

Claude Haiku 4.5

1,00 дол. США

5,00 дол. США

6,00 дол. США

Anthropic

Qwen3-Max (23.01.2026)

1,20 дол. США

6,00 дол. США

7,20 дол. США

Alibaba Cloud

Gemini 3 Pro (≤200K)

2,00 доларів США

12,00 дол. США

14,00 дол. США

Google

GPT-5.2

1,75 дол. США

14,00 дол. США

15,75 дол. США

OpenAI

Claude Sonnet 4.5

3,00 дол. США

15,00 дол. США

18,00 дол. США

Anthropic

Gemini 3 Pro (>200K)

4,00 дол. США

18,00 дол. США

22,00 дол. США

Google

Claude Opus 4.6

5,00 дол. США

25,00 дол. США

30,00 дол. США

Anthropic

GPT-5.2 Pro

21,00 дол. США

168,00 дол. США

189,00 дол. США

OpenAI

Це приблизно в 6 разів дешевше за вхідні дані та майже в 10 разів дешевше за вихідні дані, ніж Claude Opus 4.6 (5/25 дол. США). Цей реліз підтверджує чутки про те, що Zhipu AI стоїть за “Pony Alpha”, прихованої моделлю, яка раніше демонструвала високі результати в бенчмарках кодування на OpenRouter.

Однак, незважаючи на високі бенчмарки та низьку вартість, не всі перші користувачі в захваті від моделі, зазначаючи, що її висока продуктивність не розповідає всієї історії.

Лукас Петерссон, співзасновник стартапу Andon Labs, що займається протоколами безпечного автономного ШІ, зазначив у X: “Після годин читання слідів GLM-5: неймовірно ефективна модель, але набагато менш обізнана з контекстом. Вона досягає цілей агресивними тактиками, але не міркує про свою ситуацію і не використовує досвід. Це лякає. Так з’являється максимізатор скріпок”.

“Максимізатор скріпок” — це гіпотетична ситуація, описана філософом Оксфорду Ніком Бостромом ще у 2003 році. Вона полягає в тому, що ШІ або інше автономне творіння випадково призводить до апокаліптичного сценарію або вимирання людства, виконуючи, здавалося б, нешкідливу інструкцію — наприклад, максимізувати кількість вироблених скріпок — до крайності, перенаправляючи всі ресурси, необхідні для людського (або іншого життя), або іншим чином унеможливлюючи життя через свою відданість виконанню, здавалося б, нешкідливої мети.

Чи варто вашому підприємству впроваджувати GLM-5?

Підприємства, які прагнуть уникнути прив’язки до постачальника, знайдуть ліцензію MIT та відкриті ваги GLM-5 значною стратегічною перевагою. На відміну від закритих конкурентів, які тримають інтелект за пропрієтарними стінами, GLM-5 дозволяє організаціям самостійно розміщувати свій передовий інтелект.

Впровадження не позбавлене труднощів. Величезний масштаб GLM-5 — 744 мільярди параметрів — вимагає значної апаратної бази, яка може бути недоступною для менших фірм без значних хмарних або локальних кластерів GPU.

Керівники з питань безпеки повинні зважити геополітичні наслідки використання флагманської моделі з китайської лабораторії, особливо в регульованих галузях, де походження та місцезнаходження даних суворо перевіряються.

Крім того, перехід до більш автономних агентів ШІ створює нові ризики управління. Коли моделі переходять від “чату” до “роботи”, вони починають автономно працювати в різних додатках та файлах. Без надійних дозволів, специфічних для агентів, та людських контрольних точок якості, встановлених керівниками корпоративних даних, ризик автономних помилок експоненціально зростає.

Зрештою, GLM-5 є “купівлею” для організацій, які переросли прості копілоти і готові побудувати по-справжньому автономний офіс.

Вона призначена для інженерів, яким потрібно рефакторити застарілий бекенд, або для створення “самозцілювального” конвеєра, який не спить.

Тоді як західні лабораторії продовжують оптимізувати “Мислення” та глибину міркувань, Zai оптимізує виконання та масштаб.

Підприємства, які сьогодні впроваджують GLM-5, купують не просто дешевшу модель; вони роблять ставку на майбутнє, де найціннішим ШІ буде той, який зможе завершити проєкт, не потребуючи повторних запитів.

Порада від ІТ-Блог: Нова модель GLM-5 від Z.ai представляє значний прорив у сфері штучного інтелекту, пропонуючи вражаючу продуктивність, низький рівень галюцинацій та потужні можливості для автоматизації роботи з документами. Її відкритий вихідний код та доступна ціна роблять її привабливим рішенням для бізнесу, який шукає ефективні та економічні інструменти для підвищення продуктивності. Однак, потенційним користувачам варто враховувати вимоги до апаратного забезпечення та потенційні ризики, пов’язані з автономністю ШІ-агентів.

Оригінал статті: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *