
У четвер компанія Anthropic представила Opus 4.8 – найновішу ітерацію свого найпотужнішого публічно доступного інструменту штучного інтелекту. Ця модель вже доступна для всіх охочих, причому ціноутворення залишилося на рівні попереднього релізу Opus.
Прискорений цикл оновлень та конкурентний тиск
Вихід Opus 4.8 відбувся лише через 41 день після релізу Opus 4.7. Такий швидкий цикл оновлення є нетиповим для Anthropic, враховуючи, що попередні моделі Sonnet та Haiku оновлювалися три та сім місяців відповідно. Прискорення процесу могло бути зумовлене не зовсім однозначною реакцією на Opus 4.7, який, за відгуками деяких користувачів, не виправдав очікувань. Додатковий тиск на Anthropic створюють останні значні релізи від конкурентів: OpenAI представила оновлення для Codex, а Google – модель Gemini Flash. Це змушує розробників Anthropic тримати темп.
Покращена надійність та обробка невизначених даних
Opus 4.8 демонструє очікувані передові результати у стандартних тестах (бенчмарках). Однак особлива увага приділяється тому, як модель справляється з неякісними або невизначеними даними. У анонсі компанія зазначає, що перші тестувальники відзначають: нова модель “з більшою ймовірністю сигналізуватиме про невизначеність у своїй роботі та менше схильна робити необґрунтовані твердження”. Це підтверджується відгуком від компанії Bridgewater Associates, де зазначили, що ключовою перевагою оновлення стала “тенденція Opus 4.8 проактивно виявляти проблеми з вхідними та вихідними даними аналізу, що інші моделі часто пропускали, залишаючи завдання виявлення помилок користувачам”.
Нові можливості: Dynamic Workflows та перспективи Mythos
Разом із новою моделлю, Anthropic також запустила функцію Dynamic Workflows, яка наразі доступна у режимі попереднього перегляду для дослідницьких цілей. Ця система призначена для допомоги великим моделям, таким як Opus, у керуванні складними завданнями, що передбачають роботу з сотнями паралельних підзавдань (агентів).
“Claude Code у поєднанні з Opus 4.8 тепер може виконувати міграцію кодових баз масштабу сотень тисяч рядків коду, від початкового етапу до фінального коміту, спираючись на наявний набір тестів як критерій якості”, – пояснюється у прес-релізі.
Водночас, компанія все ще утримує свою найбільш передову модель Mythos. Попередній показ моделі минулого місяця викликав занепокоєння щодо кібербезпеки. Однак, Anthropic натякнула, що період попереднього доступу до Mythos може незабаром завершитися, як тільки будуть розроблені необхідні захисні механізми. “Ми досягаємо значного прогресу у розробці цих заходів безпеки і очікуємо, що зможемо надати моделі класу Mythos усім нашим клієнтам протягом найближчих тижнів”, – повідомили в компанії.
При покупці за посиланнями в наших статтях ми можемо отримувати невелику комісію. Це не впливає на нашу редакційну незалежність.
Думка ІТ-Блогу: Прискорений випуск Opus 4.8 свідчить про активну конкуренцію на ринку великих мовних моделей та прагнення Anthropic швидко реагувати на відгуки користувачів. Особливий акцент на надійності та обробці невизначених даних є важливим кроком до більшої довіри до систем штучного інтелекту у бізнесі та повсякденному житті.
Оригінал статті: techcrunch.com
