Cursor Composer 2: Новий інструмент для кодерів, що кидає виклик Claude Opus, але поступається GPT-5.4

Cursor Composer 2: Новий інструмент для кодерів, що кидає виклик Claude Opus, але поступається GPT-5.4 1

Компанія Cursor, платформа для розробки коду на основі штучного інтелекту від стартапу Anysphere, оцінена в 29,3 мільярда доларів, представила Composer 2 – нову внутрішню модель для написання коду, яка вже доступна в середовищі агентного ШІ-кодингу Cursor. Ця модель демонструє значно покращені показники порівняно з попередньою внутрішньою розробкою.

Також впроваджено й зроблено доступною версію Composer 2 Fast – швидший, але дорожчий варіант, який тепер є стандартним для користувачів.

Ось розбивка вартості:

  • Composer 2 Standard: $0.50/$2.50 за 1 мільйон вхідних/вихідних токенів

  • Composer 2 Fast: $1.50/$7.50 за 1 мільйон вхідних/вихідних токенів

Це суттєве зниження порівняно з попередньою внутрішньою моделлю Cursor, Composer 1.5, яка коштувала $3.50 за мільйон вхідних токенів та $17.50 за мільйон вихідних. Composer 2 приблизно на 86% дешевший за обома показниками.

Composer 2 Fast також приблизно на 57% дешевший за Composer 1.5.

Існують також знижки за “ціноутворення на основі кешованого читання”, що означає повторне надсилання однакових токенів у запиті до моделі: $0.20 за мільйон токенів для Composer 2 та $0.35 за мільйон для Composer 2 Fast, порівняно з $0.35 за мільйон для Composer 1.5.

Важливо відзначити, що це випуск, оптимізований спеціально для Cursor, а не загальнодоступна окрема модель. У своїй заяві та документації до моделі Cursor описує Composer 2 як доступний у Cursor, оптимізований для робочих процесів агентів Cursor та інтегрований зі стеком інструментів продукту.

Надані матеріали не вказують на окрему доступність через зовнішні платформи моделей або як загальний API поза середовищем Cursor.

Cursor зосереджується на довгостроковому кодингу, а не лише на покращених автодоповненнях

Глибша технічна заява цього випуску полягає не лише в тому, що Composer 2 показує кращі результати, ніж Composer 1.5. Cursor стверджує, що модель краще підходить для довгострокових завдань агентного кодингу.

У своєму блозі Cursor зазначає, що якісні покращення досягнуті завдяки першому етапу тривалого попереднього навчання, що забезпечило міцнішу основу для масштабованого навчання з підкріпленням. Після цього компанія стверджує, що тренувала Composer 2 на задачах довгострокового кодингу, і модель здатна вирішувати проблеми, що вимагають сотень дій.

Таке позиціонування є важливим, оскільки воно вирішує одну з найбільших невирішених проблем у галузі кодингу за допомогою ШІ. Багато моделей добре генерують ізольовані фрагменти коду. Значно менше залишаються надійними протягом тривалого робочого процесу, який включає читання репозиторію, визначення того, що змінити, редагування кількох файлів, виконання команд, інтерпретацію помилок і досягнення мети.

Документація Cursor підтверджує, що саме цей сценарій використання є пріоритетним. Вона описує Composer 2 як агентну модель з вікном контексту 200 000 токенів, оптимізовану для використання інструментів, редагування файлів та виконання термінальних операцій у межах Cursor.

Також зазначається використання таких технік тренування, як самостійне узагальнення для довготривалих завдань. Для розробників, які вже використовують Cursor як своє основне середовище, таке тісне налаштування може бути важливішим, ніж загальні заяви про лідерство в рейтингах.

Показники тестів вражають, хоча GPT-5.4 все ще лідирує в одному ключовому графіку

Cursor Composer 2: Новий інструмент для кодерів, що кидає виклик Claude Opus, але поступається GPT-5.4 2

Опубліковані Cursor результати свідчать про явне покращення порівняно з попередніми моделями Composer. Компанія зазначає показники Composer 2: 61.3 на CursorBench, 61.7 на Terminal-Bench 2.0 та 73.7 на SWE-bench Multilingual.

Для порівняння, Composer 1.5 мав показники 44.2, 47.9 та 65.9, а Composer 1 – 38.0, 40.0 та 56.9.

Цей випуск є більш зваженим, ніж деякі інші запуски моделей, оскільки Cursor не претендує на абсолютне лідерство в усіх категоріях.

На Terminal-Bench 2.0, який вимірює, наскільки добре агент ШІ виконує завдання в інтерфейсах командного рядка, GPT-5.4 все ще лідирує з показником 75.1, тоді як Composer 2 має 61.7, випереджаючи Opus 4.6 (58.0), Opus 4.5 (52.1) та Composer 1.5 (47.9).

Cursor Composer 2: Новий інструмент для кодерів, що кидає виклик Claude Opus, але поступається GPT-5.4 3

Це робить пропозицію Cursor більш прагматичною і, можливо, більш корисною для покупців. Компанія не стверджує, що Composer 2 є найкращою моделлю для всього. Вона заявляє, що модель досягла більш конкурентоспроможного рівня якості, пропонуючи привабливішу економіку та сильнішу інтеграцію з продуктом, який вже використовують розробники.

Cursor також включила діаграму співвідношення продуктивності та вартості у своєму наборі тестів CursorBench, яка, схоже, призначена для аргументації за Парето-оптимальність Composer 2.

Cursor Composer 2: Новий інструмент для кодерів, що кидає виклик Claude Opus, але поступається GPT-5.4 4

На цьому графіку Composer 2 розташований у більш вигідній точці співвідношення ціни та продуктивності порівняно з Composer 1.5, і виглядає конкурентоспроможним з вищими за вартістю налаштуваннями GPT-5.4 та Opus 4.6, представленими Cursor. Повідомлення компанії полягає не лише в тому, що Composer 2 показує вищі результати, ніж його попередник, а в тому, що він може пропонувати більш ефективний компроміс між вартістю та інтелектом для повсякденної роботи з кодом у межах Cursor.

Чому пункт «прив’язаний до Cursor» має значення для покупців

Для читачів, які вирішують, чи використовувати Composer 2, найважливішим питанням може бути не лише показники тестів. Це може бути питання, чи хочуть вони модель, оптимізовану для власного досвіду роботи з продуктом Cursor.

Це може бути перевагою. Згідно з документацією, Composer 2 має доступ до стеку інструментів агентів Cursor, включаючи семантичний пошук коду, пошук файлів і папок, читання файлів, редагування файлів, виконання команд оболонки, керування браузером та доступ до веб-ресурсів.

Такий рівень інтеграції може бути ціннішим, ніж сира якість моделі, якщо мета полягає в тому, щоб завершити реальні завдання розробки програмного забезпечення, а не просто генерувати вражаючі одноразові відповіді.

Однак це також звужує коло потенційних користувачів. Команди, які шукають модель для широкого розгортання на різних зовнішніх інструментах і платформах, повинні розуміти, що Cursor представляє Composer 2 як модель для користувачів Cursor, а не як загальнодоступну, окрему базову модель.

Ширший контекст: Cursor робить операційний аргумент

Значення Composer 2 полягає не в тому, що Cursor раптово зайняв перше місце за всіма тестами кодування. Цього не сталося. Важливішим є те, що Cursor висуває операційний аргумент: його модель стає кращою, її ціна достатньо низька, щоб заохотити ширше використання, а її швидший рівень є достатньо чутливим, щоб компанія зробила його типовим, незважаючи на вищу вартість.

Така комбінація може знайти відгук у інженерних команд, які все менше піклуються про абстрактний престиж моделей і все більше – про те, чи може асистент залишатися корисним протягом тривалих сесій кодування, не стаючи непомірно дорогим.

Ширша цінова структура Cursor допомагає окреслити конкурентний тиск навколо цього запуску. На своїй поточній сторінці ціноутворення Cursor пропонує безкоштовний рівень Hobby, план Pro за $20 на місяць, Pro+ за $60 на місяць та Ultra за $200 на місяць для індивідуальних користувачів, з вищими рівнями, що пропонують більше використання моделей від OpenAI, Anthropic та Google.

На стороні бізнесу, план Teams коштує $40 на користувача на місяць, тоді як Enterprise має індивідуальне ціноутворення та додає групове використання, централізоване виставлення рахунків, аналітику використання, налаштування конфіденційності, SSO, журнали аудиту та детальні елементи керування адміністратором. Іншими словами, Cursor стягує плату не лише за доступ до моделі кодування. Він стягує плату за керований прикладний рівень, який спирається на кількох постачальників моделей, додаючи функції для команд, управління та інструментарій робочих процесів.

Ця модель стає все більш конкурентною, оскільки першочергові компанії ШІ глибше проникають у саме кодування. OpenAI та Anthropic більше не продають моделі лише через сторонні продукти; вони також випускають власні інтерфейси кодування, агентів та системи оцінки – такі як Codex та Claude Code – ставлячи питання про те, скільки місця залишається для проміжної платформи.

Коментатори на X, хоч і неперевірені та не обов’язково репрезентативні для ширшого ринку, все частіше описують перехід від Cursor до Claude Code від Anthropic, особливо серед досвідчених користувачів, яких приваблюють робочі процеси, орієнтовані на термінал, довготривала поведінка агентів та нижчі сприймані накладні витрати.

Деякі з цих дописів описують розчарування цінами Cursor, втратою контексту або досвідом, що фокусується на редакторі, водночас вихваляючи Claude Code як більш прямий та повністю агентний спосіб роботи. Навіть якщо розглядати це обережно, подібні розмови вказують на стратегічну проблему, з якою стикається Cursor: компанія повинна довести, що її інтегрована платформа, елементи керування для команд та тепер власні внутрішні моделі додають достатньо цінності, щоб виправдати своє положення між розробниками та дедалі більш потужними продуктами для кодування від розробників моделей.

Це робить Composer 2 стратегічно важливим для Cursor.

Пропонуючи значно дешевшу внутрішню модель, ніж Composer 1.5, тісно інтегруючи її зі стеком інструментів Cursor та роблячи швидшу версію стандартною, компанія намагається показати, що вона надає більше, ніж просто обгортку навколо зовнішніх систем.

Виклик полягає в тому, що в міру вдосконалення першочергових продуктів для кодування, розробники та корпоративні покупці можуть все частіше запитувати, чи їм потрібна окрема платформа для ШІ-кодування взагалі, чи інструменти самих розробників моделей стають достатніми самі по собі.

Прогноз ІТ-Блогу: Розвиток моделей, подібних до Composer 2, свідчить про тенденцію до створення спеціалізованих, оптимізованих для платформ мовних моделей. Це може призвести до сегментації ринку, де загальні моделі конкуруватимуть з високо інтегрованими, але менш універсальними рішеннями.

Джерело новини: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *