Злетіли ціни на AI: як бізнес опановує космічні витрати на токени

Корпорації все частіше відчувають на собі зростання витрат на штучний інтелект (ШІ). Компанія Uber ще у квітні вичерпала весь свій бюджет на розробку ШІ-коду на 2026 рік. Microsoft відкликала ліцензії на Claude Code у своїх розробників через кілька місяців після їх видачі. Співробітник Priceline повідомив TechCrunch, що рутинне подовження контракту з Cursor обійшлося в 4-5 разів дорожче.

Наслідки нестримного зростання

Незважаючи на зниження вартості за токен (одиниця виміру даних, що обробляються ШІ), активне впровадження ШІ та розвиток автономних агентів призвели до стрімкого зростання споживання цих токенів. Компанії, які на початку 2025 року скупилися на необмежені підписки, тепер змушені з’ясовувати, куди витрачаються їхні кошти, скорочувати видатки та намагатися хоч якось повернути інвестиції з розвалених бюджетів.

Новий ринок оптимізації витрат на ШІ

Водночас формується ринок, який прагне задовольнити ці потреби. Стартапи, великі постачальники та нова організація зі стандартизації змагаються у створенні інструментів і мовних стандартів, що допоможуть компаніям контролювати свої витрати.

«Ще пів року тому я спілкувався з клієнтом, і розмова була про: ‘Що це може робити? Чи достатньо добре?’», — розповів Александер Ембірікос, керівник відділу корпоративних рішень OpenAI, на заході в Нью-Йорку. «Зараз ці розмови зовсім інші. Тепер нас запитують: ‘Гей, ми витрачаємо так багато. Яку видимість ви маєте? Які можливості для аудиту? Які інструменти контролю токенів? Яка ефективність ваших моделей?’»

Tokenomics Foundation: новий стандарт для контролю витрат

Саме на цьому тлі Linux Foundation цього тижня оголосила про плани створення Tokenomics Foundation — нової організації зі стандартизації, яка має на меті запровадити таку ж фінансову дисципліну щодо токенів ШІ, як FinOps зробила для хмарних витрат.

«У квітні та травні я почав чути від компаній: ‘Боже мій, ми перевищили свій річний бюджет на токени втричі, а ще тільки квітень’», — поділився Дж. Р. Стормент, виконавчий директор FinOps Foundation, проєкту під егідою Linux Foundation. «Ми почули про екзистенційні кризи, і вся розмова змістилася з ‘tokenmaxxing’ (максимізації використання токенів) та ‘рухаємося швидко’ на ‘нам потрібні запобіжники, як нам це контролювати?’»

“Епідемія крек-кокаїну” та непередбачувані витрати

За цими криками, що лунали по всьому тех-світу, стояли палкі вимоги CEO змусити команди використовувати найкращі моделі та діяти швидко, не зважаючи на витрати. Нові моделі, випущені в листопаді, такі як Claude Opus 4.5 від Anthropic, GPT-5.1 від OpenAI та Gemini 3 Pro від Google, принесли значні покращення в інструменти для автономних агентів, що багаторазово збільшило споживання. Саме тому одна компанія, за чутками, отримала рахунок на 500 мільйонів доларів від Claude, забувши встановити ліміти використання для своїх співробітників.

«Це схоже на епідемію крек-кокаїну», — зазначив Кріс Рід, старший директор з ІТ-фінансів у Priceline, додавши, що компанія почала встановлювати ліміти на токени для певних груп. «Їм дозволили спробувати, щоб ви підсіли, а тепер ви ніби від них залежні».

Невизначеність щодо ROI та зростання кількості багів

Віталій Гордон, CEO платформи інженерних операцій Faros AI, розповів про розмову з CTO, який сказав: «Один мій інженер витратив 40 000 доларів на токени минулого місяця, і я щиро не знаю, чи варто мені його зупиняти, чи йти і казати всім іншим бути такими, як він».

Дворічне дослідження 20 000 розробників, опубліковане Faros у квітні, показало, що вихідні дані зростають, але разом з ними збільшується й кількість багів та переробок. Jellyfish, платформа для управління розробкою, так само виявила, що інженери, які використовували найбільше токенів, були приблизно вдвічі продуктивнішими, ніж ті, хто використовував ШІ менше, але вони витратили в 10 разів більше токенів, щоб досягти цього.

Ніколас Арколано, керівник відділу досліджень у Jellyfish, повідомив TechCrunch, що витрати на ШІ вибухово зростають значною мірою через функціонал автономних агентів, при цьому споживання на одного розробника зросло приблизно в 18,6 раза за дев’ять місяців. Загалом, ці статистичні дані роблять питання продуктивності більш неоднозначним, ніж свідчать витрати.

«Чи виправдає себе надмірне витрачання, залежить від кінцевої бізнес-цінності відправленого коду (наприклад, доходу), яку більшість компаній досі не можуть виміряти», — зазначив Арколано.

Масштаб проблеми: трильйони рядків даних

Принаймні частина цієї проблеми вимірювання полягає в величезних масштабах використання ШІ сьогодні.

«Відстеження хмарних витрат — це проблема даних з сотнями мільйонів рядків на місяць», — сказав Стормент. «Відстеження витрат на токени — це проблема даних з трильйонами рядків на місяць. Ви не можете просто запхати це в якусь електронну таблицю чи навіть базовий інструмент. Вам доведеться кардинально переосмислити свої інструменти, специфікації та облікові системи, щоб це зробити».

У Priceline Рід вже бачить розбіжності. Він зазначив проблеми між даними про використання, наданими постачальником, і внутрішніми даними Priceline.

«Я починав свою кар’єру в управлінні витратами на телекомунікації, і я бачу всі ті ж паралелі: від телекомунікацій до хмарних технологій і до ШІ», — сказав він. «Будь-коли, коли ви запроваджуєте щось нове, це стає сприятливим ґрунтом для помилок у виставленні рахунків, аудиту та можливостей оптимізації».

Рішення на ринку: від стартапів до великих гравців

Навколо цієї проблеми починає формуватися ринок. Існують компанії, що спеціалізуються виключно на цьому, як-от Pay-i, яка відстежує, вимірює та оптимізує витрати та продуктивність інвестицій у GenAI (генеративний штучний інтелект). Paid, тим часом, дозволяє розробникам відстежувати витрати, вимірювати використання та виставляти рахунки користувачам на основі фактичної цінності, а не фіксованих абонентських плат.

Потім є такі компанії, як Jellyfish, Waydev та Faros AI, які надають моніторинг агентів ШІ для доведення ROI (повернення інвестицій) від інструментів для розробників. Стормент зазначає, що більшість із 180 постачальників у FinOps Foundation тяжіють до цього напрямку.

Компанії з існуючою дистрибуцією також додають нові функції, щоб скористатися цим новим ринком. Ramp нещодавно вийшла на ринок управління витратами на ШІ; Datadog та New Relic додали послуги, такі як управління хмарними витратами, спостережуваність на рівні токенів та моніторинг GPU (графічних процесорів). На конференції FinOps X наступного тижня AWS, як очікується, представить нові функції фінансового управління, орієнтовані на корпоративні витрати на ШІ.

Тіффані Лак, партнер NEA, вважає, що ефективність токенів та спостережуваність, ймовірно, будуть додані на «рівні зв’язування (harness) або застосунку». Вона вказала на Factory, стартап, який створює ШІ-агентів для підприємств і цього тижня запустив маршрутизатор моделей, який автоматично вибирає правильну модель для кожного завдання.

Гордон очікує, що передові лабораторії та інші постачальники моделей запровадять оптимізацію в стилі OpenRouter для спрямування запитів до найдешевших моделей — тенденція, яка вже з’являється у корпоративних рахунках Claude.

«У фінансовому звіті про те, скільки ви витрачаєте на Anthropic, навіть якщо ви використовуєте модель Opus, частина витрат буде на Sonnet або Haiku, тому що вони достатньо розумні, щоб це зробити», — сказав Гордон. «Я думаю, це буде ставати все більш поширеним явищем».

Tokenomics Foundation: шлях до стандартизації

Але всі ці інструменти будуються без спільної мови чи спільних визначень щодо вартості токена, його результатів та порівняння витрат між постачальниками. Ось тут Tokenomics Foundation сподівається стати корисною.

Фонд розробляє канонічне визначення та структуру для «токеноміки»; відкриті стандарти, специфікації та метрики для використання та білінгу токенів ШІ; а також нові метрики для економіки ШІ, такі як вартість за інтелект (cost-per-intelligence) або токени на ват (tokens-per-watt). Він також планує визначити метрики ефективності фабрики токенів та споживання. Група планує офіційний запуск у липні і незабаром оголосить про нових членів на конференції FinOps X наступного тижня.

«Економіка токенів є фундаментально більш абстрактною та непрозорою, ніж будь-що, чим ми керували в таких масштабах раніше», — заявив Нішант Гупта, директор з доступності Salesforce. «Вона вимагає іншого операційного м’яза, ніж той, який промисловість побудувала для хмарних технологій».

Тим не менш, Goldman Sachs прогнозує, що глобальне використання токенів зросте в 24 рази до 2030 року. Компанії, які вже перевищили бюджет, потребують рішень зараз, а перший результат роботи фонду буде готовий лише за кілька місяців.

«Можливо, ми створили паровий двигун, але ми ще не вигадали складальну лінію», — сказав Гордон.