OpenAI GPT-5.4: до 1 млн токенів контексту, на 33% менше помилок

Після серії неоднозначних подій, які поставили під сумнів довіру до компанії, OpenAI робить потужну заявку на відновлення репутації, представляючи свою новітню флагманську розробку — GPT-5.4. Ця модель позиціонується як революційний крок вперед для ШІ-агентів, готовий переосмислити можливості штучного інтелекту.

GPT-5.4: Новий Стандарт Флагманських Моделей

OpenAI описує GPT-5.4 як “найбільш потужну та ефективну модель для професійного використання”, що об’єднує передові досягнення у сферах логічного мислення, програмування та роботизації процесів (агентних робочих процесів) в єдину, цілісну систему. Окрім стандартної версії, розробники пропонують два спеціалізованих варіанти: GPT-5.4 Thinking, оптимізований для складних міркувань, та GPT-5.4 Pro, націлений на максимальну продуктивність. Особливо вражає API-версія, яка тепер підтримує контекстні вікна обсягом до 1 мільйона токенів – це безпрецедентний показник для OpenAI, що відкриває нові горизонти для обробки величезних масивів інформації.

Покращена Ефективність та Доступність

Компанія також акцентує увагу на значному зростанні ефективності використання токенів: GPT-5.4 потребує суттєво менше обчислювальних ресурсів (токенів) для виконання завдань порівняно з попередніми версіями. Розгортання GPT-5.4 розпочалося вже сьогодні і буде поступово інтегровано в такі платформи, як ChatGPT, Codex та API OpenAI. Користувачі, які підписані на плани Plus, Teams та Pro, отримають доступ до GPT-5.4 Thinking, тоді як GPT-5.4 Pro буде доступна через API, а також для користувачів ChatGPT Enterprise та Edu.

OpenAI GPT-5.4: до 1 млн токенів контексту, на 33% менше помилок 2

Інтелектуальні Агенти нового Покоління

Ключовою інновацією GPT-5.4 є її вбудовані можливості комп’ютерної взаємодії. Це означає, що модель здатна самостійно оперувати різними застосунками на пристрої користувача, виконуючи завдання від його імені. GPT-5.4 може не тільки генерувати програмний код, а й взаємодіяти з комп’ютером, надсилаючи команди клавіатури та миші для навігації операційною системою. Це справді значний стрибок у розвитку штучного інтелекту, спрямованого на створення автономних агентів.

Перемоги у Бенчмарках та Покращення Точності

Результати тестових випробувань (бенчмарків), представлені OpenAI, вражають. GPT-5.4 домінувала у тесті Mercor APEX-Agents, що оцінює професійні навички у сфері юриспруденції та фінансів. Модель також показала рекордні показники у тестах OSWorld-Verified та WebArena Verified, які перевіряють її комп’ютерну грамотність, і отримала високу оцінку у 83% за GDPval – тест на інтелектуальні робочі завдання.

OpenAI GPT-5.4: до 1 млн токенів контексту, на 33% менше помилок 3

Як зазначає Брендан Фуді, генеральний директор Mercor, GPT-5.4 демонструє виняткову здатність генерувати складні довгострокові результати, такі як презентації, фінансові моделі та юридичні аналізи, при цьому оптимізуючи витрати. OpenAI також наполегливо працює над зменшенням помилок та “галюцинацій” (вигаданої інформації). Згідно з їхніми даними, GPT-5.4 робить на 33% менше помилок у специфічних твердженнях порівняно з GPT-5.2, а загальна кількість відповідей із помилками скоротилася на 18%.

Нововведення в API та Безпеці

Компанія також впровадила оновлення в API, представивши функцію Tool Search. Замість того, щоб завантажувати всі доступні інструменти в системний запит, модель тепер може знаходити їх за необхідності. Це значно економить токени та прискорює обробку запитів, особливо в системах, що використовують велику кількість інструментів. Додатково, OpenAI запровадила новий механізм оцінки безпеки для аналізу “ланцюжка міркувань” (chain of thought) — проміжних етапів “мислення” моделі під час виконання багатоетапних завдань, що допомагає краще розуміти процес прийняття рішень ШІ.

OpenAI GPT-5.4: до 1 млн токенів контексту, на 33% менше помилок 4

Дослідження показали, що GPT-5.4 Thinking менш схильна до “фальсифікації” свого логічного ланцюжка, що, за словами розробників, підтверджує ефективність моніторингу проміжних пояснень як інструменту безпеки. Однак, OpenAI стикається з серйозними викликами. Згідно з повідомленнями, співпраця компанії з Міністерством оборони США призвела до відтоку близько 1,5 мільйона користувачів. Це рішення викликало бурхливу критику, особливо на тлі позиції конкурента Anthropic, який навпаки відмовився від співпраці з Пентагоном. Таке невдоволення як з боку користувачів, так і співробітників, свідчить, що навіть видатні технологічні досягнення не завжди гарантують суспільне визнання. OpenAI доведеться докласти значних зусиль, аби переконати ринок у правильності свого обраного шляху.

ChatGPT 5.3 Codex стер жорсткий диск вайбкодера одним хибодруком

Думка ІТ-Блогу: Випуск GPT-5.4 з таким значним розширенням контексту та функціоналом автономних агентів безсумнівно підніме планку для всієї індустрії ШІ, але минулі репутаційні проблеми OpenAI можуть ускладнити його прийняття. Цей реліз є чітким сигналом про майбутнє, де ШІ-інструменти будуть інтегруватися в нашу цифрову діяльність на значно глибшому рівні.

Інформація підготовлена на основі матеріалів: itc.ua

GPT-5.4: Новий Стандарт Флагманських Моделей

Покращена Ефективність та Доступність

Інтелектуальні Агенти нового Покоління

Перемоги у Бенчмарках та Покращення Точності

Нововведення в API та Безпеці

Залишити відповідьСкасувати відповідь