General Intuition: $2.3 мільярда на ставку, що відеоігри навчатимуть ШІ для реального світу

General Intuition: $2.3 мільярда на ставку, що відеоігри навчатимуть ШІ для реального світу 1

Щойно я ступив на поверх Р&D компанії General Intuition у їхньому нью-йоркському офісі, як 31-річний співзасновник і CEO Пім де Вітте одразу ж привернув мою увагу до монітора, встановленого на високому робочому столі. На екрані хтось нібито грав у щось подібне до Fortnite. Але це була не людина.

«Наш агент грає вже 100 годин поспіль», — із сяючим обличчям повідомив Кент Роллінс, директор з продукту компанії.

Перш ніж я встиг повністю зануритися в видовище штучного інтелекту, що освоював ігрове середовище, я почув електронний тупіт наближення великого чотириногого робота.

«Саме цей самий мозок, що керує агентом у грі, контролює й робота», — пояснив де Вітте.

Джош Дюплантіс, аналітик даних, який тримав ноутбук із прямим ефіром з єдиної камери робота, додав, що стандартний режим роботи бота — «дослідження».

Спираючись лише на зображення з цієї камери, гігантський, схожий на комаху, бот підійшов до мене, обійшов навколо, а потім продовжив рух офісом. Час від часу він зачіпав ніжки стільців або врізався в випадковий смітник, майже як дитина, яка ще не усвідомлює, як її тіло взаємодіє зі світом. Дюплантіс зазначив, що для тонкого налаштування моделі штучного інтелекту для чотириногого робота знадобилося лише вісім хвилин реальних даних робототехніки. Ба більше, ці дані були зібрані просто на вулиці, а не в офісі, де бот зараз навігував.

Агентна модель, здатна узагальнювати інформацію від ігрового процесу до симуляцій та фізичного втілення — це і є raison d’être (причина існування) General Intuition. І здатність цієї моделі «розуміти своє місце у світі» вже привернула увагу значних інвесторів.

У четвер General Intuition оголосила про залучення 320 мільйонів доларів при оцінці компанії в 2.3 мільярда доларів, що підтверджує попередні дані TechCrunch. Цей раунд фінансування доводить загальну суму залучених коштів General Intuition до 454 мільйонів доларів, після раунду на 134 мільйони доларів, який компанія провела на старті минулого жовтня.

Стартап був виділений з іншої компанії де Вітте — Medal, яка дозволяє геймерам завантажувати та ділитися кліпами з відеоігор. Сотні мільйонів годин завантаженого геймплею стали початковим набором даних для тренування моделі General Intuition у просторово-часовому мисленні, тобто в розумінні того, як рухатися в просторі та часі.

Однак ключовим інгредієнтом були не відео з ігор, а мітки дій, вбудовані в ці кліпи: записи про те, які саме кнопки натискав гравець і коли. Більшість конкурентів, за словами де Вітте, намагаються виводити дії лише з відео, що, на його думку, недостатньо.

«Ми розглядаємо це як наступний етап попереднього навчання, — зазначив де Вітте. — У нас є єдина модель, яка може реагувати на інформацію з екрана Fortnite та вживати заходів, а також реагувати на динаміку реального світу таким чином, на який жодна велика мовна модель (LLM) ніколи не була б здатна».

Одного разу де Вітте надав мені ноутбук із запущеною моделлю світу General Intuition — симульованим середовищем, яке генерувалося кадр за кадром, а не рендерилося традиційним ігровим рушієм. Як це часто буває під час тестування моделей світу, я впевнено рушив прямо в стіни. В інших демонстраціях, які я бачив, керовані агенти іноді проходили крізь перешкоди, але ця модель — ні. З мільйонів годин геймплею вона якимось чином засвоїла, що стіни — це стіни, драбини — для підйому, а тіні видовжуються зі зміною положення сонця.

Для General Intuition ця модель світу не є кінцевим продуктом; це навчальне середовище (всередині компанії його називають «спортзалом»). Зрештою, компанія прагне продавати саму агентну модель, і де Вітте стверджує, що дані про дії, вбудовані в геймплей, допомагають моделі розрізняти «себе» та «середовище», забезпечуючи глибше розуміння причинно-наслідкових зв’язків.

Наскільки б вражаючою не здавалася технологія General Intuition на демонстраціях, компанія не єдина, хто намагається вирішити цю проблему. Більше того, втілення такої моделі в реальному світі, масштабовано, ще не досягнуто. Більшість подібних підходів вимагають величезної кількості даних з реального світу, які збираються повільно та дорого. Ставка General Intuition полягає в тому, що геймплей є масштабованим «скороченим шляхом».

Інвестори також згодні з цією ставкою. Останній раунд General Intuition очолив Khosla Ventures за участю General Catalyst, Джеффа Безоса, Еріка Шмідта, Ніко Росберга та дослідників з Google DeepMind та MIT.

Переважна частина коштів піде на масштабування обчислювальних потужностей. General Intuition має угоду з CoreWeave і планує зосередитися на попередньому навчанні наступної версії моделі. Частина коштів також буде виділена на розширення доступності API до кінця літа.

Вінод Хосла, чия фірма очолила раунд, заявив, що його привабила візія де Вітте та унікальне положення компанії щодо даних.

«Якщо подивитися на LLM, поява міркувань (reasoning) стала квантовим стрибком, — сказав мені Хосла в телефонному інтерв’ю. — У моделях світу, я вважаю, квантовим стрибком є поява інтуїції у штучного інтелекту, здатності, подібної до людської інтуїції. Дані про людські дії та реакції, які ви маєте в іграх, є ключовим елементом для прояву інтуїції».

Візія — компанія покоління

General Intuition: $2.3 мільярда на ставку, що відеоігри навчатимуть ШІ для реального світу 2

General Intuition — не єдина компанія, яка усвідомила, що дані про людські дії з Medal є ключовим елементом для побудови динамічних моделей світу та універсальних агентів. Бріанна Мартін, керівниця апарату стартапу, зазначила, що компанія була заснована, зокрема, після того, як Medal відхилила пропозицію про придбання від великої лабораторії. З того часу були й інші пропозиції.

Де Вітте та його співзасновники — Елой Алонсо, Адам Джеллі та Вінсент Мікелі — не зацікавлені в придбанні, так само як і інвестори стартапу, які поки що не шукають виходу. Обсяг та якість пропрієтарних даних, якими General Intuition володіє через Medal, є однією з причин, чому Хосла переконаний, що стартап — це ставка на покоління, а не ціль для злиття та поглинання (M&A). Компанія має потенціал стати основою для узагальнених агентів та моделей світу в симуляції та реальному світі.

«На даному етапі це було б просто придбання даних, що досить нецікаво», — сказав Хосла.

Частина цієї ставки також передбачає довіру до цінностей де Вітте.

Підприємець три роки працював у гуманітарній сфері, зокрема з організацією «Лікарі без кордонів». З огляду на це, він чітко окреслив межі використання технологій General Intuition: жодні агенти не будуть застосовуватися для завдання шкоди людям.

«Ми не хочемо бути ескалаційною частиною системи, — заявив де Вітте. — Скажімо, якби я вийшов і сказав: «Ми розробляємо летальну автономність». Як ви думаєте, що сталося б в інших країнах?»

Це обмеження щодо військового застосування відбувається на тлі зростаючого оптимізму Кремнієвої долини щодо війни, хоча де Вітте зазначає, що був би радий, якби його моделі використовувалися для місій пошуку та порятунку.

Де Вітте — нідерландець, і значна частина його команди — європейці, що формує ідентичність компанії. Він зазначив, що запросив Мартін частково через її рішення публічно звільнитися з Palantir через співпрацю компанії з Імміграційною та митною службою США.

«Я не розумію, чому Кремнієва долина робить те, що робить, — сказав він. — Є причина, чому мене там немає».

Етичні принципи де Вітте не тільки обмежують те, що моделі не робитимуть. Як геймер, який заробив 1,5 мільйона доларів, створюючи та керуючи приватним сервером RuneScape у підлітковому віці, де Вітте також думає про тих, хто залишиться позаду через можливості моделей штучного інтелекту.

General Intuition нещодавно запустила платформу Nerve — ринок вакансій, який дозволяє геймерам заробляти гроші, використовуючи своє наявне обладнання. Ті, хто реєструється, починають з маркування даних і з часом можуть перейти до телеоперацій роботів та інших завдань. Де Вітте зазначив, що база користувачів Medal — це саме те покоління, яке найбільше піддається ризику витіснення через штучний інтелект, і він хоче, щоб вони мали частку в майбутньому.

Вихор даних

Де Вітте прагне, щоб General Intuition стала каталізатором екосистем, як Anthropic чи OpenAI — постачальником моделей, який дозволяє іншим будувати на основі своєї технології. Сьогодні стартап має кілька клієнтів у сферах геймінгу, симуляції та робототехніки.

«Ми не будемо створювати компанію з виробництва безпілотних автомобілів, — сказав де Вітте. — Ми зробимо вдесятеро простішим для наступної людини створити таку компанію».

Компанія стверджує, що після того, як її API потрапить до рук більшої кількості клієнтів, вона зможе випробувати себе в різноманітних сценаріях використання — наприклад, тестування робота в цифровому двійнику заводської підлоги, забезпечення роботи людиноподібного бота в ігровій студії або відправка чотириногого робота для навігації в небезпечних середовищах.

Хоча чотириногий робот є першим фізичним втіленням, яке General Intuition випробувала в реальному світі, компанія також тестувала дрони та інші пристрої, включно з тестуванням моделі в іграх з водінням.

«Це працює на будь-чому, що ви можете контролювати за допомогою геймпада або миші з клавіатурою», — зазначив де Вітте.

Можливість побудови «вихору даних» (data flywheel) є однією з цілей.

«Ми обиратимемо клієнтів, де ми зможемо диверсифікувати втілення, для яких ця узагальнена базова модель слугуватиме основою, — пояснив де Вітте. — Тому ми будемо пріоритезувати клієнтів залежно від того, чи зможуть вони надати реальні дані, які будуть цікавими та корисними для прогресу в дослідженнях. І якщо вони матимуть гнучку внутрішню команду, де ми зможемо бути справді інтегрованими партнерами та вчитися один у одного».

Хосла зазначив, що саме пропрієтарні дані General Intuition привели компанію так далеко, і її здатність продовжувати збирати дані, яких ніхто інший не має, буде надзвичайно важливою. Особливо тому, що, незважаючи на вражаючі демонстрації, питання про те, чи може перенесення з симуляції в реальний світ бути масштабованим, залишається відкритим, і ніхто ще не дав остаточної відповіді.

Виправлення: У заголовку раніше було невірно зазначено суму, яку General Intuition залучила в цьому раунді. Помилку виправлено.

При покупках за посиланнями в наших статтях ми можемо отримувати невелику комісію. Це не впливає на нашу редакційну незалежність.

Думка ІТ-Блогу: Новина про значні інвестиції General Intuition підкреслює зростаючий інтерес до агентних моделей, здатних розуміти та взаємодіяти з фізичним світом. Це може прискорити розробку більш складних роботизованих систем та віртуальних асистентів, але також ставить питання про етичні наслідки та потенційне домінування компаній з доступом до великих обсягів унікальних даних.

Оригінал статті: techcrunch.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *