ComfyUI досягає $500 млн оцінки: творці прагнуть контролювати AI-контент

ComfyUI досягає $500 млн оцінки: творці прагнуть контролювати AI-контент 1

ComfyUI, стартап, що допомагає творццям керувати вихідними даними зображень, відео та аудіо з дифузійних моделей за допомогою вузлового робочого процесу, залучив $30 мільйонів фінансування при оцінці в $500 мільйонів.

Раунд очолив Craft Ventures за участі інших інвесторів, зокрема Pace Capital, Chemistry та TruArrow.

Відкритий вихідний код до успішного стартапу

ComfyUI стартував як проєкт з відкритим вихідним кодом у 2023 році, невдовзі після появи дифузійних моделей (тип нейромереж, що генерують дані, подібні до реальних). На той час такі моделі, як Midjourney та DALL-E від OpenAI, були ледь функціональними та часто припускалися серйозних помилок, наприклад, додавали зайві пальці на руках.

Розробка модульного фреймворку

Щоб подолати ці обмеження, засновниками проєкту було розроблено модульний фреймворк, який надає творццям детальний контроль над кожним етапом процесу генерації. Їхній інструмент набув такого значного попиту серед креативних професіоналів, що згодом перетворився на повноцінний стартап. Наприкінці 2024 року ComfyUI залучив $19 мільйонів у рамках фінансування Серії А від інвесторів, серед яких були Chemistry Ventures, Cursor Capital та Гільєрмо Раух, засновник Vercel.

Навіщо потрібен детальний контроль?

Хоча найновіші дифузійні моделі значно просунулися від додавання шостого пальця, потреба в детальному контролі, який пропонує ComfyUI, лише зросла.

«Якщо ви думаєте про типовий підхід, заснований на промптах, як-от Midjourney чи ChatGPT, ви просите щось, і це виходить на 60-80%», — розповів TechCrunch Йоланд Ян, співзасновник і генеральний директор ComfyUI. «Але щоб змінити ці 20%, вам доводиться грати в цю гру в казино».

Ян (на фото зліва) порівняв цей процес з грою в казино, оскільки промпт моделі для внесення невеликої зміни може призвести до абсолютно іншого результату, включно з перезаписом тих частин, які вже були ідеальними.

Вузловий інтерфейс для повної влади над генерацією

Вузловий інтерфейс ComfyUI дозволяє творцям зв’язувати конкретні компоненти процесу генерації, надаючи їм повний контроль над якістю кінцевого результату.

«Ви не можете легко передати це повідомлення в полі промпта (базової моделі)», — зазначив Ян.

Творці, схоже, погоджуються, адже ComfyUI стверджує, що має понад 4 мільйони користувачів.

Широке застосування у креативній індустрії

Цей інструмент використовується креативними професіоналами для візуальних ефектів, анімації, реклами і навіть промислового дизайну. Стартап зазначає, що його пропозиція стала настільки необхідним інструментом для технічних художників та інших творців, що «художник або інженер ComfyUI» нерідко фігурує як назва посади в списках вакансій студій.

Хоча базові моделі для відео та зображень продовжують вдосконалюватися, Ян стверджує, що вони далекі від досконалості, і такі інструменти, як ComfyUI, залишатимуться високо затребуваними.

«У світі, де «AI-шлак» буде всюди, версія ComfyUI з підходом «людина в контурі» (human-in-the-loop) зрештою виграє найбільшу увагу», — сказав він.

Серед конкурентів ComfyUI — Weavy, стартап, який минулого року був придбаний Figma.

Коли ви здійснюєте покупки за посиланнями в наших статтях, ми можемо отримувати невелику комісію. Це не впливає на нашу редакційну незалежність.

Думка ІТ-Блогу: Залучення значного фінансування ComfyUI свідчить про зростаючу потребу в інструментах, які надають глибший контроль над генеративним ШІ, що особливо важливо для професійних користувачів. Це демонструє, що майбутнє ШІ-контенту не обмежується простими запитами, а йде в бік складних, контрольованих робочих процесів.

Оригінал статті: techcrunch.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *