Представлено нові можливості генеративного ШІ від Google
Компанія Google анонсувала випуск нової моделі для генерації зображень Nano Banana 2 Lite, яка позиціонується як найшвидша та найдоступніша у своєму сімействі. Паралельно відкрився доступ для розробників до моделі Gemini Omni Flash, призначеної для створення та редагування відеоматеріалів за допомогою текстових інструкцій.
Nano Banana 2 Lite: Швидкість та Ефективність
Модель Nano Banana 2 Lite вже інтегрована в такі платформи, як Google AI Studio, Gemini API та Gemini Enterprise Agent Platform. Крім того, вона поступово з’являється в низці споживчих сервісів Google, включно з Gemini, AI Mode в Search, NotebookLM, Google Photos та Google Ads. Основна перевага Nano Banana 2 Lite полягає в її здатності генерувати зображення з високою швидкістю та низькою вартістю. Процес створення одного зображення займає приблизно чотири секунди, а вартість генерації зображення з роздільною здатністю 1000 пікселів становить $0,034. Попри акцент на продуктивності, Google запевняє, що модель зберігає високу точність виконання запитів, стабільність візуалізації персонажів між різними генераціями та коректне відображення тексту в межах зображень.
Gemini Omni Flash: Генерація та Редагування Відео
Gemini Omni Flash, вперше представлений на конференції Google I/O, тепер доступний для розробників. Ця модель підтримує створення та редагування відеоконтенту на основі текстових описів, зображень та вже існуючих відеофрагментів. Серед ключових функцій Gemini Omni Flash варто виділити:
- Редагування відео за допомогою природної мови.
- Використання різноманітних вхідних даних для збереження стилістики сцени.
- Синхронізація текстових елементів з діями у відео.
- Застосування знань Gemini для побудови сюжетів.
Наразі модель підтримує генерацію відео тривалістю до 10 секунд, з планами на розширення цієї підтримки в майбутньому. Вартість використання становить $0,10 за секунду відео, що співставно з цінами моделі Veo 3.1 Fast.
Інтеграція та Безпека
Google продемонструвала приклади ефективної взаємодії обох моделей. Наприклад, Nano Banana 2 Lite може оперативно створювати зображення, які потім Gemini Omni Flash перетворює на короткі анімовані відео. Для демонстрації таких сценаріїв були розроблені тестові додатки, що включають сервіс для віртуальних подорожей, інструмент для дизайну інтер’єрів та платформу для створення рекламних відео з використанням фотографій товарів. Важливою особливістю є те, що весь контент, згенерований цими моделями, автоматично маркується цифровим водяним знаком SynthID. Ця технологія допомагає ідентифікувати матеріали, створені або модифіковані за допомогою штучного інтелекту.
Додаткові Новини
Нагадаємо, нещодавно Google також зробила персоналізовану генерацію зображень у Gemini доступною безкоштовно для користувачів у США. Ця функція використовує дані сервісів Google для створення зображень, що відповідають інтересам та вподобанням користувача.
Вердикт ІТ-Блогу: Розробники, які працюють з генерацією контенту, а також компанії, що потребують швидкого створення візуальних матеріалів, мають розглянути інтеграцію цих нових інструментів.
За даними порталу: mezha.ua
