## Google розширює сімейство мовних моделей: представлено Gemma 4 для дата-центрів та Gemini Nano 4 для смартфонів Після випуску Gemini 3 Pro наприкінці минулого року, який став значним досягненням у сфері великих мовних моделей (LLM), Google продовжує інновації. Компанія оголосила про випуск нового сімейства відкритих моделей під назвою Gemma 4, переносячи частину передових технологій Gemini у відкритий доступ. ### Версії Gemma 4: від смартфонів до потужних систем Gemma 4 представлено у чотирьох конфігураціях, що відрізняються кількістю параметрів. Для мобільних пристроїв та периферійних обчислень розроблено “Effective”-моделі з 2 та 4 мільярдами параметрів. Для більш вимогливих завдань доступні 26-мільярдна модель “Mixture of Experts” та 31-мільярдна “Dense” модель. Параметри в LLM є ключовими налаштуваннями, що визначають здатність моделі генерувати відповіді. Як правило, більша кількість параметрів забезпечує вищу якість результатів, але вимагає значно потужніших обчислювальних ресурсів. Google зазначає, що моделі Gemma 4 досягли “безпрецедентного рівня інтелекту на параметр”. ### Висока продуктивність та багатомовність Підтвердженням заявленої ефективності є результати 31-мільярдної та 26-мільярдної версій Gemma 4, які посіли третє та шосте місця відповідно у рейтингу Arena AI. Це вражає, зважаючи на те, що вони випередили моделі, які за розміром перевищують їх у 20 разів. Ключовою особливістю всіх моделей Gemma 4 є їхня здатність обробляти відео та зображення, що робить їх ідеальними для таких завдань, як оптичне розпізнавання символів (OCR). Молодші версії (2 та 4 мільярди параметрів) також можуть обробляти аудіовходи та розпізнавати мовлення. Крім того, Gemma 4 має унікальну можливість генерувати програмний код в офлайн-режимі, дозволяючи розробникам працювати без постійного підключення до мережі. Моделі були навчені на даних понад 140 мовами. ### Відкритість та свобода використання На відміну від попередніх версій Gemma, які розповсюджувалися під власною ліцензією Google, сімейство Gemma 4 випускається під ліцензією Apache 2.0. Це надає розробникам значно ширші можливості для адаптації та інтеграції цих моделей у свої проєкти.
Вердикт ІТ-Блогу: Обов’язкове оновлення для розробників, дослідників та компаній, які прагнуть інтегрувати передові можливості штучного інтелекту у свої продукти та сервіси, особливо для завдань, що вимагають обробки мультимедійного контенту та офлайн-генерації коду.
Джерело новини: itc.ua
