
Alibaba Cloud у неділю представила HappyHorse 1.1, значне оновлення своєї моделі генерації відео за допомогою штучного інтелекту, яка, за заявами компанії, забезпечує професійне синтезування відео для ключових сценаріїв створення контенту. Модель вже доступна на Alibaba Cloud Model Studio з повним API-доступом для корпоративних клієнтів та розробників, а також супроводжується 40% знижкою на весь асортимент протягом перших двох тижнів.
Випуск відбувся на тлі помітних зрушень на ринку генерації відео за допомогою ШІ, і Alibaba, схоже, чудово усвідомлює цей момент. OpenAI припинила використання Sora, оскільки вона виявилася фінансово невигідною. ByteDance тимчасово призупинила міжнародний запуск Seedance 2.0 після хвилі скарг щодо порушення авторських прав від голлівудських студій. Для команд закупівель підприємств, які оцінювали або інтегрували ці інструменти у свої робочі процеси маркетингу, реклами та виробництва контенту, конкурентне середовище за кілька місяців різко скоротилося.
Це скорочення створює як можливості, так і виклики для Alibaba. HappyHorse 1.1 — це не дослідницька демонстрація чи споживча іграшка. Це продукт, орієнтований на API, створений для інтеграції в корпоративні програмні стеки, ціноутворений для масового використання та підкріплений інвестиціями у розмірі 52,7 мільярда доларів у глобальну інфраструктуру. Те, чи зможе він перетворити технічні можливості на корпоративне впровадження, особливо на західних ринках, що переживають посилення технологічної напруженості між США та Китаєм, визначить, чи зможе Alibaba зарекомендувати себе як серйозний гравець на ринку генеративного відео, який, за прогнозами аналітиків, досягне десятків мільярдів доларів до кінця десятиліття.
Як HappyHorse піднявся від анонімної тестової записи до провідної моделі відеогенерації
HappyHorse вперше з’явився на початку квітня як анонімна заявка на Artificial Analysis Video Arena — незалежній платформі бенчмаркінгу, де реальні користувачі порівнюють результати роботи моделей у сліпих, побічних оцінках. Модель негайно зайняла першу позицію як у текстово-відео, так і в зображувально-відео рейтингах. Згодом було підтверджено, що розробником є Alibaba, і компанія розкрила, що над моделлю працював підрозділ AI Innovation Unit компанії ATH (Alibaba Token Hub) — команда, яка раніше входила до Future Life Lab у складі Taobao and Tmall Group, перед стратегічною реорганізацією.
За даними Arena.ai, HappyHorse 1.0 наразі займає 2-гу позицію у всіх трьох таблицях лідерів Video Arena. Платформа зазначила, що модель набирає 1 444 бали як у текстово-відео, так і в зображувально-відео категоріях, випереджаючи Google Veo-3.1 (з аудіо) на 69 балів у текстово-відео та xAI Grok-Imagine-Video на 23 бали у зображувально-відео. У системах рейтингу на основі Ело, таких як Arena, моделі отримують або втрачають бали залежно від того, чи віддають користувачі перевагу їхнім результатам у прямих порівняннях. Це означає, що стійка перевага у двозначних числах відображає постійний розрив у якості, сприйнятий людьми-оцінювачами, а не статистичну випадковість.
Архітектура моделі пояснює чому. Згідно з технічною документацією, зібраною спільнотою, HappyHorse побудований навколо універсального трансформера з 15 мільярдами параметрів та механізмом самостійної уваги, який обробляє текстові, зображувальні, відео- та аудіо-токени в межах однієї послідовності токенів. На відміну від багатьох конкурентів, які зшивають окремі моделі для відео та аудіо, HappyHorse працює як уніфікована система, що обробляє всі модальності за один прохід генерації, усуваючи необхідність стороннього дубляжу чи пост-обробки аудіоінструментів. Для корпоративних покупців, які оцінюють загальну вартість володіння, така архітектурна простота прямо трансформується у меншу кількість точок інтеграції, меншу залежність від постачальників і швидший час виходу на ринок.
Що виправляє оновлення 1.1 — і чому це важливо для комерційного виробництва відео
Оновлення 1.1 спрямоване на вирішення низки проблем, з якими команди з виробництва відео для підприємств знайомі досконало. Alibaba Cloud описала випуск як “систематично оптимізований для основних сценаріїв генерації контенту”, а конкретні покращення розкривають модель, яка була налаштована для комерційного розгортання, а не для вірусних демонстрацій у соціальних мережах.
Найбільш значущим оновленням є можливість багаторазового референтного зображення, яку Alibaba називає R2V (Reference-to-Video). Ця функція дозволяє користувачам завантажувати кілька референтних зображень персонажів і підтримувати послідовну ідентичність протягом згенерованого відео — це безпосередньо вирішує одну з найскладніших проблем у виробництві ШІ-відео, де об’єкти мають тенденцію до зміни зовнішнього вигляду між кадрами або сценами. Для брендів, які створюють рекламні кампанії, відео продуктів або серіалізований маркетинговий контент, послідовність ідентичності є не бажаною опцією, а вимогою, яка історично змушувала команди повертатися до традиційних методів виробництва.
Якість руху отримала значне оновлення завдяки тому, що Alibaba описує як “посилене моделювання руху”, яке усуває попередні обмеження у швидкості та плавності. Компанія також внесла цілеспрямовані покращення до візуальної текстури, зокрема, усунувши “жирність обличчя”, “надмірну різкість” та “неприродні текстури” — артефакти, які переслідували комерційне ШІ-відео з моменту появи цієї технології і які одразу сигналізують глядачам, що контент створений машиною.
Два додаткові оновлення доповнюють випуск. HappyHorse 1.1 покращує синхронізацію аудіо та відео, включаючи те, що Alibaba називає “синхронізацією губ з нульовим дрейфом” для діалогових сцен та контекстно-залежне відтворення мови — це доповнює вже помітну здатність версії 1.0 генерувати до 15 секунд відео 1080p із синхронізованим аудіо. Модель також покращує виконання інструкцій для довгих і складних запитів, що є критично важливим диференціатором для корпоративних користувачів, яким потрібно точно визначати рухи камери, умови освітлення та сюжетні моменти в одному проході генерації, замість того, щоб робити десятки спроб.
Згортання Sora та заморожування Seedance залишають покупців підприємств з меншим вибором, ніж будь-коли
Конкурентний контекст навколо цього запуску надзвичайно сприятливий для Alibaba, і варто зрозуміти чому.
Веб- та мобільні додатки OpenAI Sora були припинені 26 квітня, а API Sora буде закрито 24 вересня. Припинення роботи сталося після того, як продукт виявився фінансово нежиттєздатним: операційні витрати Sora становили приблизно 1 мільйон доларів на день, тоді як загальний дохід склав лише близько 2,1 мільйона доларів, а кількість активних користувачів зменшилася з пікових майже 1 мільйона до менш ніж 500 000. Для команд підприємств, які інтегрували Sora у свої виробничі конвеєри, раптове припинення роботи підкреслило ризики залежності від продуктів ШІ, які не мають стійкої бізнес-моделі — це повчальна історія, яку закупники навряд чи швидко забудуть.
Seedance 2.0 від ByteDance, який багато хто вважав найсильнішим наступником Sora, зіткнувся з іншим типом перешкод. Netflix, Warner Bros., Disney, Paramount і Sony надіслали ByteDance юридичні попередження щодо звинувачень у системному порушенні авторських прав після того, як користувачі згенерували вірусні кліпи з використанням інтелектуальної власності Голлівуду. ByteDance тимчасово відклала міжнародний запуск, і глобальне розгортання залишається призупиненим.
Таким чином, Google Veo 3.1 залишається головним західним конкурентом у сфері генерації відео для підприємств. Але рейтинги Alibaba Arena свідчать про те, що HappyHorse перевершує Veo за якістю, що сприймається користувачами, а 40% знижка на запуск на Alibaba Cloud Model Studio може зробити HappyHorse значно дешевшим у великих обсягах. На рівні 1.0, ціни через сторонні API-платформи становили приблизно 1,82 долара за 10-секундний кліп у 720p і 3,12 долара у 1080p. З промоційною ціною HappyHorse 1.1 може зробити генерацію відео за допомогою ШІ виробничої якості доступною для компаній середнього ринку та агентств, які раніше вважали цю технологію занадто дорогою для чогось, окрім експериментів.
Інвестиції Alibaba у розмірі 52,7 мільярда доларів у інфраструктуру надають HappyHorse перевагу у дистрибуції, яку конкуренти не можуть зрівняти
HappyHorse 1.1 не існує ізольовано. Він спирається на глобальну інфраструктурну експансію, яка відрізняє Alibaba від компаній, що спеціалізуються виключно на моделях ШІ, які створюють вражаючі технології, але не мають фізичних та комерційних механізмів для масштабованого обслуговування регульованих корпоративних клієнтів.
Лише за п’ять днів до запуску HappyHorse 1.1 Alibaba Cloud відкрила свої перші центри обробки даних у Франції, створивши свій третій європейський хаб після Німеччини та Великобританії. Парижський регіон включає дві зони доступності, доводячи глобальну присутність компанії до 105 зон доступності у 32 регіонах. “Розширення нашої хмарної інфраструктури до Франції підсилює нашу постійну відданість наданню європейським підприємствам суверенних, безпечних та інтелектуальних рішень”, — заявила доктор Фейфей Лі, технічний директор та президент міжнародного бізнесу Alibaba Cloud, у повідомленні компанії. У Японії компанія відкрила свій п’ятий центр обробки даних у Токіо 19 червня.
Як повідомляє Data Center Dynamics, генеральний директор Едді Ву зобов’язався інвестувати 52,7 мільярда доларів у створення “єдиної глобальної хмарної мережі”, з подальшим розглядом збільшення цієї суми до 69 мільярдів доларів. Лише цього року Alibaba запустила нові регіони в Мексиці, Таїланді, Джохорі (Малайзія) та Франції. Розгортання у Франції також є частиною плану Alibaba Cloud щодо впровадження агентських ШІ-сервісів корпоративного рівня по всій Європі у другій половині року, включаючи AgentRun (платформу розробки для ШІ-агентів), STAROps (платформу інтелектуальних операцій) та ACS Agent Sandbox (що забезпечує апаратну ізоляцію безпеки для навантажень агентів).
Нарощування інфраструктури слугує подвійній меті для такого продукту, як HappyHorse. Запуск моделі генерації відео з 15 мільярдами параметрів з інтегрованим аудіо є надзвичайно ресурсомістким. Наявність локальної інфраструктури зменшує затримку для корпоративних API-запитів, одночасно зберігаючи дані клієнтів у межах нормативних вимог. Для європейських покупців, які працюють за новим фреймворком технологічного суверенітету Європейської Комісії — опублікованим 3 червня з чіткою метою захисту “цифрової незалежності” блоку — можливість виконувати робочі навантаження генерації відео за допомогою ШІ на локально розміщеній інфраструктурі є не розкішшю. Це стає дедалі частіше вимогою відповідності.
Список Пентагону та геополітичний ризик нависають над західними амбіціями Alibaba
Глобальний наступ Alibaba розгортається під значним геополітичним тиском, який корпоративні покупці не можуть ігнорувати. Пентагон додав Alibaba, разом із BYD та Baidu, до списку китайських військових компаній 8 червня, не дозволивши їм отримати контракти Міністерства оборони США. Alibaba відкинула це визначення, заявивши, що вона “не є китайською військовою компанією і не є частиною будь-якої стратегії військово-цивільної інтеграції”.
Включення до списку автоматично не призводить до санкцій і не обмежує безпосередньо комерційні транзакції між приватними американськими компаніями та Alibaba. Але це додає шар репутаційної та регуляторної складності до рішень про закупівлі, особливо для компаній, що мають зв’язки з урядом США, входять до ланцюгів постачання оборонної промисловості або мають трансатлантичні операції. Закупівлі корпоративних технологій рідко оцінюються виключно за технічними характеристиками — оцінка ризиків постачальника, перевірка відповідності на рівні ради директорів та планування геополітичних сценаріїв — все це враховується при прийнятті рішень про закупівлю хмарної інфраструктури та інструментів ШІ.
Для європейських клієнтів, зокрема, розрахунок ускладнюється по-іншому. Зростаюча увага континенту до цифрового суверенітету діє у двох напрямках одночасно: вона створює попит на альтернативи домінуючим американським гіперскейлерам (Amazon Web Services, Microsoft Azure та Google Cloud контролюють приблизно 70% доходу від європейської хмарної інфраструктури, за даними Synergy Research Group), але також викликає питання, чи китайський постачальник представляє собою значне покращення стратегічної автономії. Стратегія Alibaba щодо створення інфраструктури, що відповідає вимогам суверенітету, на ринку є прямою спробою відповісти на це питання — але список Пентагону гарантує, що воно буде ставитися знову і знову.
На що звернути увагу командам підприємств, поки ринок відеогенерації за допомогою ШІ консолідується
Практичні наслідки HappyHorse 1.1 для команд підприємств є значними. HappyHorse підтримує чотири режими генерації — текст-у-відео, зображення-у-відео, об’єкт-у-відео та нещодавно додане редагування відео — охоплюючи весь спектр комерційних відеопотреб від ідеї до виробництва та пост-продакшну, все з інтегрованим аудіо без додаткових витрат. Ця широта можливостей, що надається через єдину API-точку, спрощує те, що історично було фрагментованим і дорогим виробничим конвеєром.
Питання на майбутнє полягає в тому, чи зможе Alibaba перетворити домінування на бенчмарках та конкурентний момент на міцні корпоративні відносини. Компанія планує випустити HappyHorse через Alibaba Cloud Model Studio з повними SLA для підприємств, сертифікаціями безпеки та регіональною відповідністю — це базові вимоги, які відокремлюють дослідницькі прориви від послуг виробничого класу. Слідкуйте за розкриттями інформації клієнтами, метриками використання та тим, чи швидко сторонні платформи, такі як fal.ai та Atlas Cloud (які вже розміщують HappyHorse 1.0), оновляться до версії 1.1, що свідчитиме про справжній попит розробників поза межами екосистеми Alibaba.
Ринок генерації відео за допомогою ШІ увійшов у 2026 рік з трьома надійними претендентами для корпоративного сегменту. Один з них мертвий. Один заморожений. А той, що залишився, — це китайська компанія, підкріплена інвестиціями в інфраструктуру на суму 52,7 мільярда доларів, яка посідає 2-е місце у всіх основних незалежних бенчмарках і пропонує 40% знижку всім, хто готовий зробити ставку. У корпоративних технологіях найкращий продукт не завжди перемагає — але він рідко програє, коли конкуренція вже залишила поле.
Прогноз ІТ-Блогу: HappyHorse 1.1, ймовірно, стане каталізатором для подальшої консолідації ринку ШІ-відеогенерації, спонукаючи конкурентів до зниження цін та прискорення інновацій. Ми очікуємо, що в найближчі 1-2 роки з’являться нові рішення, які зосередяться на специфічних нішах, таких як інтерактивний контент або персоналізовані відео для кінцевого споживача, що значно розширить сфери застосування цієї технології.
Джерело новини: venturebeat.com
