Відомий дослідник Ян Лекун, якого часто називають одним із “батьків сучасних нейромереж”, зібрав понад 1 мільярд доларів (приблизно 40 мільярдів гривень за поточним курсом) для свого нового стартапу Advanced Machine Intelligence. Ця компанія планує розвивати альтернативний підхід до розробки штучного інтелекту, відмовившись від домінуючої парадигми великих мовних моделей (LLM) на користь концепції так званих “моделей світу” (world models).
Не інтелект, а генератор слів
Ян Лекун протягом понад десятиліття очолював дослідницький напрямок штучного інтелекту в компанії Meta. Саме він стояв біля витоків розробки згорткових нейронних мереж – ключової технології, що стала фундаментом для сучасних систем комп’ютерного зору. Проте, незважаючи на значний внесок, дослідник вирішив залишити корпорацію, щоб заснувати власну компанію та реалізувати своє бачення майбутнього ШІ.
Останні роки індустрія штучного інтелекту значною мірою зосередилася на великих мовних моделях. Це системи, що лежать в основі роботи популярних чатботів та генеративних сервісів. LLM навчаються на гігантських масивах даних, що дозволяє їм генерувати тексти та вести складні діалоги. Однак, за своєю суттю, вони є складними статистичними машинами, які лише прогнозують наступне слово, не маючи справжнього розуміння контексту або теми розмови.
На думку Лекуна, навіть подальше масштабування поточних моделей не дозволить досягти рівня справжнього інтелекту. Він зазначає, що з кожним новим релізом від таких технологічних гігантів, як OpenAI, Meta та Google, помітна різниця між версіями стає все менш відчутною, що свідчить про вичерпання потенціалу поточного підходу.
Ставка на “моделі світу”
Лекун відкрито критикує сучасні ШІ-системи, називаючи їх “тупими”, та пропонує принципово іншу архітектуру – “моделі світу”. На відміну від LLM, ці моделі повинні навчатися розуміти причинно-наслідкові зв’язки, планувати дії та взаємодіяти з фізичною реальністю. В основу цієї стратегії лягла архітектура, яку він назвав Joint Embedding Predictive Architecture (JEPA).
Традиційні моделі часто намагаються обробляти кожен окремий піксель у відеопотоці, що потребує величезних обчислювальних потужностей і генерує значний обсяг “шуму” (нерелевантної інформації). JEPA працює інакше: вона оперує в так званому “латентному просторі”, де модель опрацьовує абстрактні представлення даних. Іншими словами, система не акцентує увагу на дрібних деталях, а натомість вивчає ключові взаємозв’язки між подіями. Сам Лекун характеризує такий підхід як розвиток “фізичного інтелекту”, що є значним кроком вперед у створенні справді розумних систем.
Думка ІТ-Блогу: Залучення такої значної суми від провідного експерта у сфері ШІ свідчить про потенційну зміну парадигми в розробці штучного інтелекту, зсуваючи акцент з простих мовних моделей на глибше розуміння світу. Це може призвести до появи нових, більш потужних та універсальних застосунків ШІ, які зможуть краще взаємодіяти з фізичним світом та виконувати складніші завдання.
Інформація підготовлена на основі матеріалів: itc.ua
