Gemini: новий Lyria 3 генерує музику за фото

Google DeepMind інтегрує Lyria 3 в Gemini: Новий рівень музичної творчості зі штучним інтелектом

Застосунок Gemini від Google тепер озброєний найсучаснішою музичною нейромережею Lyria 3, розробленою підрозділом DeepMind. Це значне оновлення відкриває користувачам безпрецедентні можливості для створення музики.

На відміну від попередніх ітерацій, Lyria 3 звільняє користувачів від необхідності самостійно писати тексти пісень. Система штучного інтелекту здатна генерувати лірику на основі наданих підказок. Більше того, Lyria 3 надає глибокий контроль над такими параметрами, як вокал, музичні стилі, темп та безліч інших елементів, дозволяючи створювати надзвичайно реалістичні та складні музичні композиції.

Повага до авторських прав та творча свобода

Google наголошує, що Lyria 3 розроблялася з акцентом на оригінальне самовираження, а не на копіювання стилів відомих виконавців. Компанія запевняє, що процес навчання моделі відбувався з ретельним дотриманням законодавства про авторське право та угод з партнерами. Якщо користувач у запиті вказуватиме на популярних артистів, Gemini трактуватиме це як загальний творчий імпульс, генеруючи композиції, що перегукуються за настроєм та темпом. Для запобігання порушенням передбачено механізми фільтрації, що перевіряють згенерований контент на предмет схожості з існуючими музичними творами.

Gemini: новий Lyria 3 генерує музику за фото 2

Інтерфейс застосунку Gemini тепер містить новий розділ «Музика» у меню «Інструменти». Тут користувачі можуть надавати детальні описи бажаного жанру, емоційного забарвлення, навіть специфічних жартів чи особистих спогадів, які стануть основою для створення унікальних треків. Це стосується як пісень з вокалом, так і суто інструментальних композицій.

Для ілюстрації, приклад запиту наводить 9to5google: «Мене переповнює ностальгія. Напиши для моєї мами пісню про прекрасні часи, які ми провели в дитинстві, і про спогади про її домашні банани. Зроби її веселою афробіт-композицією зі справжньою африканською атмосферою».

Додаткова функція дозволяє завантажувати фото або відео, які Gemini використає як візуальну основу для генерації пісні з текстом, що відповідає настрою зображення чи відеоряду. Результатом роботи стає 30-секундна композиція, а для візуального супроводу використовується модель Nano Banana для створення відповідної обкладинки.

Gemini: новий Lyria 3 генерує музику за фото 3

Усі створені композиції будуть позначені водяним знаком SynthID. Це дозволить користувачам завантажити аудіофайл у Gemini та перевірити, чи був він згенерований штучним інтелектом. Наразі Lyria 3 доступна для користувачів віком від 18 років англійською, німецькою, іспанською, французькою, хінді, японською, корейською та португальською мовами. Підписники Google AI Plus, Pro та Ultra отримають розширені ліміти використання.

Раніше ми повідомляли про інтеграцію Gemini в Google Docs для створення аудіо-резюме документів. Також нещодавно Google запровадила режим Personal Intelligence (Персональний інтелект) у бета-версії Gemini, який перетворює ШІ на проактивного особистого помічника.

Думка ІТ-Блогу: Інтеграція Lyria 3 в Gemini значно розширює можливості креативних інструментів на базі ШІ, роблячи їх доступними широкому колу користувачів. Це може призвести до появи нових форм цифрової творчості та змінити підходи до музичного продакшну, демократизуючи його.

Дізнатися більше на: itc.ua

Gemini: новий Lyria 3 генерує музику за фото

Google DeepMind інтегрує Lyria 3 в Gemini: Новий рівень музичної творчості зі штучним інтелектом

Повага до авторських прав та творча свобода

Залишити відповідьСкасувати відповідь

Gemini 3.6 Flash від Google: Зменшення витрат на токени для ШІ-агентів до 65% для інженерних завдань та майбутнє 3.5 Pro

OpenAI: Hugging Face зламали через їхні власні бета-моделі

Jack Dorsey кидає виклик Slack: Buzz — нова платформа для групових чатів команд та їхніх ШІ-агентів