
Компанія OpenAI анонсує обмежений попередній доступ до свого новітнього сімейства передових моделей ШІ GPT-5.6, яке представлене трьома варіантами: Sol, Terra та Luna.
Sol призначений для найскладніших завдань, таких як складне програмування та дослідження безпеки; Terra – для високообсягових бізнес-завдань, як-от підтримка клієнтів, внутрішні інструменти та аналіз документів; Luna – для швидкої, недорогої повсякденної роботи, як-от узагальнення, редагування та рутинна автоматизація. Sol та Terra встановлюють нові високі показники за бенчмарками, тоді як Luna демонструє результати, близькі до GPT-5.5, на кількох тестах, незважаючи на позиціювання як найшвидшої та найдоступнішої моделі в сімействі GPT-5.6.
Однак спочатку моделі стануть доступними для вузького кола приблизно 20 організацій, після того, як OpenAI поділилася моделями та планами випуску з урядом США. Загальний випуск заплановано на “найближчі тижні”.
Поетапний випуск відповідає виконавчому указу, виданому президентом Дональдом Трампом раніше цього місяця, 2 червня 2026 року, який закликає різні федеральні відомства співпрацювати в процесі бенчмаркінгу та оцінки можливостей нових моделей ШІ для забезпечення їх безпеки та відповідності для широкого випуску.
Поки цей процес триває (згідно з указом, він має тривати 30 днів, тобто до 2 липня), OpenAI заявляє у своєму блозі про випуск, що вона “розглянула наші плани та можливості моделей перед сьогоднішнім запуском. На прохання [уряду США], ми розпочинаємо з обмеженого попереднього доступу для невеликої групи довірених партнерів”.
Стратегія обмеженого попереднього доступу OpenAI також випливає з рішучого кроку уряду США щодо видання наказу про експортний контроль проти Anthropic, головного конкурента OpenAI в США, через виявлені “джейлбрейки” в їхній найпотужнішій загальнодоступній моделі Claude Fable 5. У відповідь Anthropic усунув будь-який доступ до цієї моделі та її аналога, орієнтованого на кібербезпеку, Claude Mythos 5, для публічного чи приватного використання. (Anthropic раніше надавала попередню версію моделі як “Claude Mythos Preview” обмеженому колу зовнішніх учасників своєї програми досліджень кібербезпеки “Project Glasswing” ще з квітня).
Оскільки OpenAI координує свою систему випуску з Білим домом перед ширшим публічним запуском, корпоративні покупці повинні орієнтуватися в новому ландшафті втручань безпеки в реальному часі, обов’язкових параметрів відповідності та структурованих систем кешування токенів.
Як відрізняються 3 нові моделі GPT-5.6: Sol проти Terra проти Luna
Три моделі GPT-5.6 розроблені для задоволення різних корпоративних потреб та профільов продуктивності.
Sol – це преміальний варіант, створений для найвимогливіших завдань, таких як складне міркування, тривалі сесії програмування, розширені робочі процеси на базі агентів та застосунки, орієнтовані на безпеку.
Sol забезпечує найвищий рівень можливостей, але має найвищу ціну: 5,00 $ за мільйон вхідних токенів / 30,00 $ за мільйон вихідних токенів — як і GPT-5.5. OpenAI стверджує, що він забезпечує значний приріст продуктивності для тривалих завдань програмування, кібербезпеки та роботи агентів.
Terra поєднує високу продуктивність з ефективністю. Вона призначена для великомасштабних виробничих середовищ, де організаціям потрібні надійні результати у великих обсягах роботи без надмірних витрат найдосконалішої моделі. Вона доступна за ціною 2,50 $/15 $ за 1 мільйон токенів.
Luna – це найлегший і найефективніший за вартістю варіант, оптимізований для швидкості та повсякденного використання. Вона добре підходить для простіших завдань, рутинних робочих процесів та застосунків, де чуйність і масштабованість важливіші за максимальну глибину міркувань, і є найдоступнішою за ціною: 1 $/6 $ за мільйон токенів відповідно на вхід та вихід.
Джерела, обізнані з внутрішньою роботою OpenAI, повідомили VentureBeat, що нова схема найменування була розроблена, щоб відмовитися від варіантів “nano” та “mini” GPT-5, оскільки ці моделі не настільки відрізняються за розміром або сирим інтелектом, а натомість призначені для різних, чітко визначених сценаріїв використання.
Як зазначає OpenAI у своєму блозі про нову схему найменування: “У цій новій системі найменувань, запровадженій з GPT‑5.6, номер ідентифікує покоління моделі, тоді як Sol, Terra та Luna визначають стійкі рівні можливостей, які можуть розвиватися за власним графіком. Разом сімейство надає людям і розробникам чіткіший вибір між інтелектом, швидкістю та вартістю”.
Крім того, джерела повідомили, що OpenAI прагнула викликати відчуття натхнення, дивлячись на космос та пов’язані з ним назви.
Більше того, Sol добре вписується в програму Daybreak від OpenAI за підпискою для організацій, зацікавлених у використанні моделей OpenAI для посилення кіберзахисту, що є додатковим бонусом. Голосовий стиль “Sol” для голосового режиму OpenAI в ChatGPT не пов’язаний із цим і, ймовірно, буде перейменований.
Нова системна картка GPT-5.6 додає ще один важливий пункт для бізнесу: OpenAI класифікує всі три моделі GPT-5.6 — не тільки Sol — на рівень ризику “Високий” як для кібернетичних, так і для біологічних/хімічних можливостей, водночас оцінюючи їх нижче цього рівня щодо самовдосконалення ШІ. Це означає, що навіть дешевші рівні Terra та Luna можуть нести нові зобов’язання щодо управління для компаній, які використовують їх у сферах безпеки, наук про життя або інших чутливих робочих процесах.
Ось як вони співвідносяться з рештою провідних моделей LLM за ціною — зверніть увагу, що найдоступніший варіант OpenAI загалом є моделлю середньої ціни і все ще дорожчий за GLM-5.2 на передовому рівні.
Знімок цін API передових моделей ШІ за версією VentureBeat
|
Модель |
Вхідні дані |
Вихідні дані |
Загальна вартість |
Джерело |
|
MiMo-V2.5 Flash |
0,10 $ |
0,30 $ |
0,40 $ |
Xiaomi MiMo |
|
deepseek-v4-flash |
0,14 $ |
0,28 $ |
0,42 $ |
DeepSeek |
|
deepseek-v4-pro |
0,435 $ |
0,87 $ |
1,305 $ |
DeepSeek |
|
MiniMax-M3 |
0,30 $ |
1,20 $ |
1,50 $ |
MiniMax |
|
Gemini 3.1 Flash-Lite |
0,25 $ |
1,50 $ |
1,75 $ |
|
|
Qwen3.7-Plus |
0,40 $ |
1,60 $ |
2,00 $ |
Alibaba Cloud |
|
MiMo-V2.5 |
0,40 $ |
2,00 $ |
2,40 $ |
Xiaomi MiMo |
|
Grok 4.3 (низький контекст) |
1,25 $ |
2,50 $ |
3,75 $ |
xAI |
|
MiMo-V2.5 Pro (≤256K) |
1,00 $ |
3,00 $ |
4,00 $ |
Xiaomi MiMo |
|
Kimi-K2.6 |
0,95 $ |
4,00 $ |
4,95 $ |
Moonshot/Kimi |
|
GLM-5.2 |
1,40 $ |
4,40 $ |
5,80 $ |
Z.ai |
|
GPT-5.6 Luna |
1,00 $ |
6,00 $ |
7,00 $ |
OpenAI |
|
Grok 4.3 (високий контекст) |
2,50 $ |
5,00 $ |
7,50 $ |
xAI |
|
MiMo-V2.5 Pro (>256K) |
2,00 $ |
6,00 $ |
8,00 $ |
Xiaomi MiMo |
|
Qwen3.7-Max |
2,50 $ |
7,50 $ |
10,00 $ |
Alibaba Cloud |
|
Gemini 3.5 Flash |
1,50 $ |
9,00 $ |
10,50 $ |
|
|
Gemini 3.1 Pro Preview (≤200K) |
2,00 $ |
12,00 $ |
14,00 $ |
|
|
GPT-5.6 Terra |
2,50 $ |
15,00 $ |
17,50 $ |
OpenAI |
|
GPT-5.4 |
2,50 $ |
15,00 $ |
17,50 $ |
OpenAI |
|
Gemini 3.1 Pro Preview (>200K) |
4,00 $ |
18,00 $ |
22,00 $ |
|
|
Claude Opus 4.8 |
5,00 $ |
25,00 $ |
30,00 $ |
Anthropic |
|
GPT-5.5 |
5,00 $ |
30,00 $ |
35,00 $ |
OpenAI |
|
GPT-5.5 Instant (chat-latest) |
5,00 $ |
30,00 $ |
35,00 $ |
OpenAI |
|
Sakana Fugu Ultra (≤272K) |
5,00 $ |
30,00 $ |
35,00 $ |
Sakana AI |
|
GPT-5.6 Sol |
5,00 $ |
30,00 $ |
35,00 $ |
OpenAI |
|
Claude Fable 5 / Claude Mythos 5 |
10,00 $ |
50,00 $ |
60,00 $ |
Anthropic |
Технологія: глибше міркування та робота на основі під-агентів
Основна технічна зміна в GPT-5.6 полягає в наданні моделі більшого часу та структури для вирішення складних завдань під час виведення.
OpenAI додає новий режим максимального міркування для GPT-5.6 Sol, спрямований на проблеми, що вимагають тривалішого обмірковування.
OpenAI також впроваджує “ультра-режим”, який залучає під-агентів, здатних розподіляти та прискорювати складні проєкти, замість того, щоб тримати роботу в рамках одного агента.
Оцінки запуску компанії свідчать, що такий підхід покращує продуктивність на кількох завданнях стилю роботи агентів.
Бенчмарки демонструють помітне покращення порівняно з GPT-5.5 та новий стан справ на завданнях командного рядка TerminalBench 2.1
Серія GPT-5.6 демонструє чіткий стрибок продуктивності порівняно з попередніми поколіннями у складних міркуваннях та довгострокових завданнях.

У завданнях автоматизації командного рядка, оцінених на TerminalBench 2.1, як флагманська модель Sol, так і модель середнього рівня Terra випереджають попередній бенчмарк GPT-5.5. Варто зазначити, що Sol використовував новий режим “ultra thinking” для досягнення рекордного результату у 91,91% на бенчмарку, а режим “max” показав 88,76% — вище, ніж 83,4% у GPT-5.5 та 88% у Claude Mythos 5.
Ця перевага поширюється на професійні робочі процеси в Agent’s Last Exam, де Sol є єдиною моделлю, яка успішно подолала позначку в 50,9% виконання завдань у “режимі коду”, тоді як повсякденний рівень Luna також ледь перевершує флагман попереднього покоління.

У кількісних тестах з біології та геноміки Sol та Terra досягають вищих показників точності, ніж GPT-5.5 та GPT-5.4. Sol досягає цих сильніших результатів, споживаючи менше токенів.
Нарешті, в оцінках кібербезпеки, що вимірюють дослідження вразливостей та їх експлуатацію, нові моделі долають попередні стелі продуктивності; Sol досягає значно вищих показників бажаного рівня експлуатації зі зростанням часу міркувань і досягає конкурентоспроможних рівнів можливостей, використовуючи лише частину вихідних токенів, необхідних старішим моделям.
За даними ExploitBench, OpenAI стверджує, що Sol працює на рівні Mythos Preview, генеруючи приблизно третину вихідних токенів.

Механізми передбачуваного кешування запитів та прискорення від Cerebras
Щоб допомогти підприємствам контролювати непередбачувані криві витрат під час виконання циклів роботи агентів, API GPT-5.6 представляє оновлений протокол кешування запитів.
Розробники тепер можуть реалізовувати явні точки зупину кешу, що підтримуються гарантованим мінімальним терміном життя кешу в 30 хвилин.
У рамках цієї системи початковий запис у кеш коштує у 1,25 раза дорожче за стандартну ставку вхідних даних моделі без кешування, тоді як подальше читання з кешу отримує знижку 90%.
На практиці компанії, які виконують повторні або подібні операції, платять більше за створення кешу, а потім значно менше щоразу, коли вони повторно використовують цей кешований контекст протягом мінімального вікна кешування щонайменше 30 хвилин.
Для систем, які регулярно передають величезні контекстні вікна або визначення кодових баз назад у модель, ця передбачуваність є критично важливим фінансовим запобіжником.
Крім того, для корпоративних застосунків, де затримка є основним бар’єром для впровадження, OpenAI запускає GPT-5.6 Sol на обладнанні Cerebras цього липня.
Це партнерство в галузі інфраструктури обіцяє швидкість обробки до 750 токенів на секунду, націлюючись на спеціалізовані корпоративні застосунки, що вимагають міркувань передового рівня в реальному часі.
Наслідки для підприємств: висока безпека та алгоритмічні перешкоди
Для команд інженерів, інформаційної безпеки та комплаєнсу розгортання GPT-5.6 вимагає ретельного вивчення його архітектури безпеки.
Щоб отримати дозвіл на випуск, OpenAI виділила приблизно 700 000 годин роботи GPU A100e виключно для автоматизованого червоного тестування (red-teaming) GPT-5.6. Ці обчислювальні ресурси були спрямовані на виявлення “універсальних джейлбрейків” — системних векторів атаки, призначених для обходу захисту в різних контекстах, а не поодиноких обхідних шляхів.
OpenAI стверджує, що впровадила багатошаровий стек захисту, який працює в реальному часі, створюючи навмисні операційні перешкоди для команд безпеки підприємств.
-
Відмова на рівні моделі: GPT-5.6 налаштована відхиляти заборонену допомогу з кібербезпеки, включаючи запити, що маскують зловмисні наміри або намагаються обійти захист у стилі “джейлбрейк”.
-
Перевірка зловживання в прямому ефірі: Окремі детектори кібербезпеки та біологічних загроз перевіряють генерації під час їх створення.
-
Перевірка на основі активації: Для Sol і Terra OpenAI додає класифікатори активації, які відстежують внутрішні сигнали моделі під час виведення. Якщо ці системи виявляють ризикований шаблон, потік виведення може призупинитися, поки інша перевірка безпеки переглядає контент. Luna, схоже, не отримує такого ж рівня класифікаторів активації, хоча вона все ще охоплена іншими системами моніторингу.
-
Призупинення перевірки міркувань: Коли ризик зростає, генерація може зупинитися, поки більша система міркувань аналізує обмін та навколишній контекст. Якщо система класифікує виведення як недозволене, відповідь блокується перед досягненням кінцевої точки.
Оскільки легітимна оборонна робота — така як перегляд коду, виявлення вразливостей, розробка патчів та оборонне тестування — часто використовує ті самі кодові примітиви, що й атакуючі експлойти, OpenAI визнає, що її класифікатори можуть регулярно спрацьовувати як помилкові спрацьовування.
Системна картка свідчить, що стек моніторингу OpenAI показав 94,8% загального виявлення на своєму наборі даних для оцінки біологічних загроз і 81,6% загального виявлення на своєму наборі даних для оцінки кібербезпеки. Ці цифри надають підприємствам рідкісний кількісний погляд на системи захисту, але вони також свідчать про те, що система не є досконалою і може пропустити деякі ризиковані випадки або заблокувати деяку легітимну роботу.
Постійне позначення може призвести до автоматизованих перевірок облікових записів за історичними розмовами для оцінки того, чи займається корпоративний клієнт зловмисною поведінкою чи стандартними дослідженнями безпеки. OpenAI наразі веде переговори щодо довгострокових елементів контролю відповідності безпеці підприємств, включаючи засоби обходу безпеки, керовані клієнтом, та механізми виявлення, що зберігають конфіденційність, щоб захистити корпоративні дані від ручних конвеєрів перевірки.
Важливо, що OpenAI зазначає, що під час тестування Sol залишається оптимізованим для оборонного стримування, а не для наступального розгортання. В оцінках, проведених на кодових базах Chromium та Firefox, модель успішно виявила помилки та примітиви експлуатації, але не змогла самостійно створити функціональний, повноцінний експлойт, залишаючись безпечно нижче порогу оповіщення організації “Cyber Critical”.
Однак усі три моделі GPT-5.6 перетнули його “високий” поріг у кібербезпеці під час внутрішнього тестування “Захопи прапор” (capture-the-flag), причому Sol досяг 96,7%, Terra – 91,84%, а Luna – 85,19%.
Ця відмінність важлива для корпоративних покупців безпеки: OpenAI представляє GPT-5.6 як достатньо потужний, щоб допомогти автоматизувати частини дослідження вразливостей та аналізу експлойтів, але ще не як систему, яка може надійно провести повну кампанію передових атак без людського керування за тестових умов компанії.
Геополітика поетапного випуску
Ширший випуск серії GPT-5.6 відображає ескалацію взаємозв’язку між передовими лабораторіями ШІ та протоколами національної безпеки.
Рішення обмежити початковий доступ вузькому колу перевірених партнерів, чиї дані передаються уряду США, випливає з прямої координації щодо розробки рамкових положень президентського указу про кібербезпеку. OpenAI зробила незвичайний крок, публічно критикуючи таке суверенне контролювання в офіційній документації свого продуктового анонсу. Компанія прямо заявляє:
“Ми не вважаємо, що такий процес доступу уряду має стати довгостроковим стандартом. Він позбавляє найкращих інструментів користувачів, розробників, підприємств, оборонців кіберпростору та глобальних партнерів, які їх потребують”.
Ця напруженість висвітлює нестабільне становище сучасних технологічних підприємств. Хоча організації можуть використовувати безпрецедентну ефективність агентів та надійні можливості лагодження вразливостей через такі бенчмарки, як ExploitGym та ExploitBench, вони також повинні визнати, що доступ до преміальних інструментів залишається предметом дипломатичної та регуляторної авторизації.
Прогноз ІТ-Блогу: Подальший розвиток лінійки GPT-5.6, ймовірно, зосередиться на оптимізації під-агентних систем для ще складніших завдань, а також на глибшій інтеграції з інфраструктурами, що забезпечують підвищену безпеку та передбачуваність витрат. Зростаюча співпраця з урядовими органами може призвести до появи спеціалізованих версій моделей, призначених для національної безпеки та критичної інфраструктури.
За матеріалами: venturebeat.com
