
Google вдосконалює генерацію зображень ШІ з новим оптимізованим рішенням
Google сьогодні оновлює свої можливості генерації зображень за допомогою штучного інтелекту, представляючи Nano Banana 2 (NB2) Lite — оптимізовану модель, створену для швидкого виконання та роботи в умовах обмежених інфраструктурних бюджетів. Технічно позначена як Gemini 3.1 Flash-Lite Image в програмному інтерфейсі Google (API), NB2 Lite позиціонується як найшвидший та найефективніший за вартістю варіант у сімействі творчих моделей Google, здатний генерувати зображення за 4 секунди за фіксованою ставкою 0,034 долара США за 1000 зображень. Вона негайно стає доступною для корпоративних розробників через Google AI Studio, Gemini API та Gemini Enterprise Agent Platform (GEAP). Ця модель не така швидка чи гнучка, як нещодавно представлена Krea 2 Turbo від стартапу Krea, яка має частково відкриту ліцензію та дозволяє модифікації та комерційне використання малими підприємствами. Однак головною перевагою NB2 Lite є низька ціна та інтеграція з ширшими пропозиціями Google для роботи та ШІ. Цей реліз збігається з публічною попередньою версією Gemini Omni Flash, мультимодальної моделі для генерації та редагування розмовних відео. Проте, тоді як Omni Flash представляє довгострокову ставку Google на агентне маніпулювання відео, Nano Banana 2 Lite є негайним робочим інструментом інфраструктури, спеціально розробленим для комерційних додатків з високою пропускною здатністю, швидкого програмного прототипування та автоматизованих робочих процесів генерації активів.
Технологія швидкості
В основі Nano Banana 2 Lite лежить архітектура Gemini 3.1 Flash Lite, розроблена для вирішення постійної суперечності між затримкою обчислень та операційними витратами. У високошвидкісних корпоративних системах традиційні великомасштабні моделі зображень створюють значні перешкоди через багаторазові затримки обробки в кілька секунд та високі витрати на токен. Нова полегшена модель Google обходить ці вузькі місця, генеруючи стандартне зображення роздільною здатністю 1k менш ніж за чотири секунди. Це значна оптимізація продуктивності порівняно з її попередником, Nano Banana (Gemini 2.5 Flash Image), досягнута завдяки цільовим вдосконаленням базових можливостей. Згідно з внутрішньою документацією, модель має покращені знання про світ для створення чернеток візуалізацій даних та контекстних макетів, підвищену узгодженість персонажів для збереження ідентичності в безперервних потоках зображень та можливості локалізованого рендерингу типографіки. Компроміси, притаманні цьому “Lite” позначенню, прозоро викладені в технічних специфікаціях Google. На відміну від ширших лінійок стандартної Nano Banana 2 (NB2) та Nano Banana Pro (NB Pro), які підтримують гнучке масштабування роздільної здатності до 1k, 2k та 4k, Nano Banana 2 Lite обмежує підтримку роздільної здатності виключно 1k. Проте, в межах цього спеціалізованого операційного діапазону, архітектурне налаштування дає дивовижно конкурентні переваги. У стандартизованих внутрішніх тестах Nano Banana 2 Lite досягла оцінки Elo в арені “Текст до зображення” 1251. Ця оцінка значно перевищує попередню оцінку NB1 у 1151 і вражаюче випереджає потужнішу та дорожчу NB Pro, яка має 1245 у тій самій категорії “текст до зображення”. Для спеціалізованих завдань редагування модель зберігає оцінку Elo для редагування одного зображення 1308 та для редагування кількох зображень 1294, забезпечуючи високооптимізовану точку для програм реального часу.
VB Transform · 14–15 липня · Менло-Парк · Агентна оркестрація
Intuit перебудував свою багатоагентну систему за 60 днів. Що вони змінили — і чому?
На Transform керівники інженерних відділів з Intuit, Target та Instacart розкривають, як вони переробили свої архітектури оркестрації для надійності, масштабу та реальних клієнтів.
Дивіться повний розклад →
Прискорення швидкого прототипування та маркетингових досліджень
З точки зору реалізації продукту, Google позиціонує Nano Banana 2 Lite не як художній двигун, а як невидимий, високопродуктивний рівень утиліти для автоматизованих робочих процесів. Цільова аудиторія охоплює інженерів-програмістів, платформи програмної реклами та додатки для цифрової комерції, де швидка ітерація є критично важливою. Уявіть собі A/B тестування в реальному часі для тисяч варіантів цільової реклами або негайні коригування макетів на локалізованих вітринах магазинів. Google виділяє три конкретні виробничі середовища, де модель демонструє виняткові результати. По-перше, її знання про світ дозволяють системам миттєво створювати точні контекстуальні сцени або локалізовані макети. По-друге, узгодженість персонажів забезпечує суворі вимоги інструментів створення раскадровок та цифрових примірок одягу, де збереження статичної точності об’єктів у послідовних генераціях історично було складним завданням. Нарешті, покращення рендерингу тексту означають, що читабельний текст можна безпосередньо вбудовувати в швидкі рекламні генерації, дозволяючи командам на льоту перевіряти сумісність макетів різними мовами. Однак розробники повинні враховувати, що хоча нативна генерація зображень працює з найнижчими затримками, завдання умовного редагування зображень можуть мати незначно вищі часи відгуку через вторинні рівні обробки, необхідні для перезапису існуючих пікселів.
Ліцензування та доступ
Механізм розгортання Nano Banana 2 Lite через пропрієтарні API підкреслює комерційну стратегію ліцензування, орієнтовану на корпоративний сегмент. На відміну від моделей з відкритими вагами, які розробники можуть завантажити для локального запуску в рамках фреймворків з відкритим кодом, таких як Apache 2.0 або модифіковані ліцензії OpenRAIL, новітні моделі Google залишаються тісно інтегрованими в її керований хмарний стек. Для підприємств це усуває операційну складність розміщення обладнання, але прив’язує використання суворо до умов виставлення рахунків Google. Фінансово ця комерційна стратегія є надзвичайно агресивною. За ціною 0,034 долара США за 1000 зображень через канали AI Studio та GEAP, модель перевершує старішу, менш потужну модель NB1 (0,039 долара США) і значно знижує витрати порівняно зі стандартними рівнями NB2 (0,067 долара США) та NB Pro (0,134 долара США). Внутрішні нотатки свідчать, що модель забезпечує приблизно 60–70% загальних можливостей NB2 та NB Pro, працюючи при значно вищих швидкостях і за частку від вартості. Знижуючи фінансовий бар’єр для високочастотної генерації зображень, Google робить пряму ставку на залучення корпоративних розробників до своєї екосистеми комерційних платформ.
Прогноз ІТ-Блогу: NB2 Lite є важливим кроком до демократизації генеративного ШІ для бізнесу, знижуючи поріг входу для створення візуального контенту. Ймовірно, це стимулюватиме появу нових інструментів та сервісів, які раніше були економічно недоступними для малого та середнього бізнесу, а також прискорить інновації в автоматизації маркетингу та дизайну.
Інформація підготовлена на основі матеріалів: venturebeat.com
