Liquid AI презентує LFM2.5-230M: Найменша модель, що перевершує гігантів у видобутку даних

## Революція в галузі штучного інтелекту: Невеликі моделі для локальних розгортань Компанія Liquid AI, заснована колишніми науковцями з MIT, представила свою найменшу на сьогодні мовну модель – LFM2.5-230M. Ця інноваційна розробка має потенціал трансформувати способи використання штучного інтелекту (ШІ) в бізнесі, зокрема у сферах вилучення даних та локального розгортання на мобільних пристроях, ноутбуках і робототехніці.

Ключові характеристики LFM2.5-230M

LFM2.5-230M – це базова модель з 230 мільйонами параметрів, спеціально розроблена для автономних агентських процесів безпосередньо на пристроях. Її компактність, як зазначають розробники, дозволяє запускати її практично «будь-де». Примітно, що за даними Liquid AI, ця модель перевершує за ефективністю на певних тестах моделі, що в чотири рази перевищують її за кількістю параметрів, особливо у вилученні даних, де вона демонструє кращі результати, ніж Alibaba Qwen3.5-0.8B (Instruct) з 800 мільйонами параметрів та Google Gemma 3 1B з 1 мільярдом параметрів.

Liquid AI презентує LFM2.5-230M: Найменша модель, що перевершує гігантів у видобутку даних 1

Модель орієнтована на розробників та інженерів, які створюють ефективні конвеєри вилучення даних та автономні системи для периферійних пристроїв.

Гнучка ліцензія та архітектурна ефективність

LFM2.5-230M розповсюджується під подвійною комерційною ліцензією. Вона безкоштовна для індивідуальних розробників та компаній з річним доходом менше 10 мільйонів доларів США. Більші корпорації потребують укладання платної угоди. Ця модель вирізняється серед інших компактних ШІ-рішень завдяки своїй архітектурі LFM2, яка забезпечує високу швидкість роботи (inference) без значних витрат пам’яті, типових для великих трансформерних моделей. На відміну від провідних компаній, таких як Anthropic, OpenAI, Google, Microsoft, Meta, що змагаються у збільшенні кількості параметрів до сотень мільярдів чи трильйонів для досягнення передових результатів, існує паралельний напрямок розвитку, зосереджений на периферійних розгортаннях. Випуск LFM2.5-230M від Liquid AI свідчить про перехід до архітектурної ефективності замість «грубої сили» масштабування. Компанія демонструє, що для виконання складних, багатоетапних агентських процесів на периферійних пристроях не потрібна колосальна обчислювальна потужність або постійне підключення до хмари.

Принцип роботи LFM2.5-230M

Архітектура LFM2.5-230M відрізняється від стандартних трансформерів. Вона функціонує як гібридна система, що поєднує зважені згортки короткого радіусу дії з увагою до групованих запитів (grouped-query attention) для ефективної обробки інформації. Цей підхід, подібно до інших розробок у сфері ефективних архітектур, має на меті ефективно управляти довгими контекстами та послідовними даними на периферійному обладнанні, уникаючи квадратичних витрат пам’яті, властивих чистим механізмам уваги. Модель підтримує значне вікно контексту до 32K, що дозволяє обробляти об’ємні документи або безперервні потоки телеметричних даних з роботів. Аналіз продуктивності моделі демонструє її архітектурну ефективність. LFM2.5-230M зберігає обсяг пам’яті менше 400 МБ, водночас досягаючи швидкості заповнення (prefill) та декодування, що перевищує показники аналогічних моделей, таких як Gemma 3 1B IT та Granite 4.0-H-350M. На смартфоні Samsung Galaxy S25 Ultra з процесором Qualcomm Snapdragon Gen4 модель досягає швидкості декодування 213 токенів на секунду. Навіть на Raspberry Pi 5 модель демонструє швидкість декодування 42 токени на секунду.

Значення для підприємств

Традиційно компанії використовували жорсткі, засновані на правилах скрипти ETL (Extract, Transform, Load) для обробки даних. Однак ці застарілі системи є вразливими: незначна зміна формату документа або оновлення схеми може порушити весь процес. Галузь переходить до «AI ETL», де машинне навчання автоматично вивчає відповідності, виявляє зміни схеми та адаптується до них. В сучасних легковагих конвеєрах вилучення даних ШІ-модель підключається до неструктурованих джерел (PDF, електронні листи, веб-форми) і структурує дані у форматах, як-от JSON, без потреби у жорстко закодованих правилах. Використання величезних флагманських моделей, як-от Claude Opus 4.6 (з вартістю 5 доларів США за мільйон вхідних токенів), для аналізу рахунків-фактур, форматування адрес або маршрутизації телеметричних даних є економічно недоцільним для компаній. Саме тут моделі, подібні до LFM2.5-230M, стають критично важливими. Розроблена як легковагий інструмент для вилучення даних, вона дозволяє компаніям автоматизувати рутинне форматування та парсинг даних з мінімальними витратами обчислювальних ресурсів та затримками, працюючи безпосередньо на локальному обладнанні, а не покладаючись на дорогі постійні виклики хмарних API.

Бенчмарки невеликих моделей: LFM проти класу 3B

У середині 2026 року галузь ШІ переживає відродження «невеликих» моделей, хоча поняття «невеликий» значно варіюється. Нещодавно спільнота з відкритим кодом була вражена моделлю VibeThinker-3B від Weibo (3 мільярди параметрів), яка показала вражаючий результат 94.3 на математичному бенчмарку AIME 2026, конкуруючи з моделями, що мають 600 мільярдів параметрів, завдяки агресивній курації даних та навчанню з підкріпленням. Аналогічно, сімейство моделей Gemma 4 від Google (з понад 200 мільйонами завантажень) виводить передовий ШІ на периферію, зокрема модель E2B (2 мільярди параметрів), розроблену спеціально для мобільних пристроїв та IoT. На противагу цьому, LFM2.5-230M від Liquid AI працює у зовсім іншій ваговій категорії. Маючи лише 230 мільйонів параметрів, вона приблизно вдесятеро менша за найменшу модель Gemma 4 від Google та VibeThinker-3B. Через свій мініатюрний розмір LFM2.5-230M не призначена для конкуренції у завданнях, що вимагають складного мислення, як-от просунута математика, кодування або творче письмо – обмеження, яке Liquid AI відкрито визнає. Однак у своїх цільових сферах – вилученні даних та виклику інструментів – модель значно перевищує свої параметри. Бенчмарки, опубліковані Liquid AI, показують, що LFM2.5-230M набрала 43.26 на бенчмарку використання інструментів BFCLv3, перевершивши IBM Granite 4.0-350M (39.58) і значно випередивши більші моделі з 1 мільярдом параметрів, як-от Google Gemma 3 1B IT (16.61).

Liquid AI презентує LFM2.5-230M: Найменша модель, що перевершує гігантів у видобутку даних 2

На тесті CaseReportBench для вилучення даних LFM2.5-230M демонструє результат 22.51, значно випереджаючи Qwen3.5-0.8B (Instruct). Це підтверджує, що поки 3-мільярдні моделі, як VibeThinker, вирішують складні математичні задачі, 230-мільйонна модель LFM2.5-230M є оптимальним, високооптимізованим вибором для ефективного виконання структурованих викликів інструментів та підтримки агентських конвеєрів на обмеженому обладнанні.

Передові дослідження та розробки

Завдяки своїй здатності ефективно викликати інструменти, LFM2.5-230M функціонує переважно як рівень вибору навичок. Liquid AI продемонструвала цю спроможність, розгорнувши модель на гуманоїдному роботі Unitree G1. Працюючи повністю на бортовому обчислювальному модулі NVIDIA Jetson Orin робота, модель успішно обробляє складні команди, пов’язані з навколишнім середовищем. Як зазначено у технічному блозі компанії, модель приймає вільну інструкцію, наприклад: «Стій нерухомо 2 секунди, потім пройди вперед зі швидкістю 1 метр на секунду на 3 метри, прийми позу одноногого коліна на 5 секунд, а потім пройди назад зі швидкістю 0.5 метра на секунду на 3 метри». Вона автоматично перетворює цю інструкцію на структурований багатоетапний план, який викликає попередньо навчені низькорівневі навички, надані фреймворком NVIDIA SONIC. Базові та донавчені моделі доступні на Hugging Face з негайною підтримкою в екосистемі інференсу для llama.cpp (GGUF), MLX, vLLM, SGLang та ONNX.

Подвійна ліцензія LFM Open License

Liquid AI розповсюджує LFM2.5-230M за ліцензією LFM Open License v1.0. Хоча в назві присутнє слово «open», це не є ліцензією, сумісною з Open Source Initiative (OSI). Вона діє як обмежена, подвійна комерційна ліцензія. Для незалежних розробників, дослідників та стартапів ця ліцензія функціонує аналогічно до програмного забезпечення з відкритим кодом. Користувачі отримують довічну, всесвітню, безкоштовну ліцензію на відтворення, модифікацію та розповсюдження моделі, за умови збереження оригінальних повідомлень про авторські права та чіткого зазначення будь-яких змін. Однак ліцензія містить суворе «Обмеження комерційного використання». Будь-яка юридична особа, що отримує 10 мільйонів доларів США або більше річного доходу, втрачає право на комерційне використання моделі за цією угодою. Великі підприємства, що досягають цього фінансового порогу, повинні укласти окрему, платну комерційну угоду з Liquid AI для розгортання моделі в продакшн. Така стратегія захищає інтелектуальну власність компанії від безкоштовного поглинання великими технологічними конгломератами, одночасно сприяючи її поширенню серед розробників початкового рівня.

Прогноз ІТ-Блогу: Ми очікуємо, що успіх LFM2.5-230M стимулюватиме подальші дослідження в галузі архітектурної оптимізації для ШІ. Ймовірно, з’являться нові моделі, що спеціалізуються на гранично ефективному вилученні даних та виконанні завдань на периферійних пристроях, що ще більше розширить сферу застосування ШІ поза хмарними дата-центрами.

Дізнатися більше на: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *