Perplexity AI презентувала гібридну систему обробки даних: хмара та локальне розгортання на Computex 2026

Perplexity AI презентувала гібридну систему обробки даних: хмара та локальне розгортання на Computex 2026 1

Компанія Perplexity AI, стартап у сфері пошукових технологій, оцінений у 20 мільярдів доларів, на виставці Computex 2026 представила свій інноваційний підхід до оркестрації локального та хмарного машинного навчання. Розроблена система самостійно, в режимі реального часу та під час виконання завдання, визначає, які обчислювальні навантаження штучного інтелекту залишаться на пристрої користувача, а які будуть передані на обробку передовим хмарним моделям.

Генеральний директор Perplexity AI, Аравінд Срінівас, продемонстрував цю технологію під час виступу генерального директора Intel, Ліп-Бу Тана. Використовуючи агент “Personal Computer” від Perplexity, система обробляла конфіденційні матеріали угод. Локальні моделі, що працюють на процесорах Intel Core Ultra Series 3, визначали, яка інформація має залишатися на комп’ютері, а яка може бути надіслана до хмарних сервісів. Срінівас зазначив, що такий підхід забезпечує оптимальний баланс між інтелектом, точністю, приватністю даних та економічною ефективністю.

Ключова інновація полягає не в можливості локального запуску моделей, що вже є функцією багатьох існуючих рішень. Головне досягнення Perplexity – це здатність системи самостійно приймати рішення щодо маршрутизації завдань, аналізуючи кожне з них окремо, без необхідності попереднього вибору з боку користувача. Це означає, що конфіденційні дані, такі як фінансова чи медична інформація, залишаються на локальному пристрої, тоді як складніші обчислювальні задачі, що потребують потужності передових моделей, направляються до хмари. Результат – одне завдання, але з можливістю виконання у різних середовищах, кероване автоматичною оркестрацією.

«Жоден продукт раніше не робив цього», – зазначив представник Perplexity в електронному листі. Поки що ця функція не доступна користувачам, але, за словами компанії, її запуск очікується протягом найближчих тижнів.

Шлях Perplexity від хмарних агентів до оркестрації на пристрої

Щоб зрозуміти важливість цієї демонстрації на Computex, варто простежити еволюцію продукту Perplexity з початку цього року.

25 лютого Perplexity представила Computer – багатомодельний AI-агент, який використовує 19 різних моделей для виконання складних, довготривалих завдань. Ця система працювала виключно у хмарі, розбиваючи завдання на підзавдання та направляючи кожне до моделі (Claude, Gemini, GPT, Grok чи інших), яка найкраще відповідала його специфіці. Perplexity Computer об’єднав усі сучасні можливості ШІ в єдину систему, функціонуючи як універсальний цифровий помічник, що використовує ті самі інтерфейси, що й користувач.

У березні Perplexity представила Personal Computer на своїй першій конференції розробників Ask 2026. Цей продукт був запущений як новий додаток для Mac з підтримкою гібридного локально-хмарного AI-агента. Компанія описала його як «персонального оркестратора», що поєднує локальне та серверне середовища для забезпечення безпеки та продуктивності. Personal Computer мав доступ до файлової системи Mac та нативних додатків, дозволяючи створювати та виконувати повні робочі процеси. Файли створювалися у безпечному середовищі (sandbox), а всі дії були відстежуваними та зворотними.

Демонстрація на Computex розширює цю архітектуру на фундаментальному рівні. Раніше, навіть у продукті Personal Computer, розподіл завдань був відносно чітким: доступ до локальних файлів здійснювався на пристрої, тоді як інтенсивні обчислення виконувалися на серверах Perplexity.

Новий оркестратор гібридного інференсу (обробки даних) надає самій системі можливість аналізувати, яка частина завдання має виконуватися де – не лише яка модель використовується, а й яке фізичне місце обробляє дані. Система запитує дозвіл користувача перед відправленням конфіденційних даних до хмари, що вирішує одне з ключових занепокоєнь підприємств щодо автономних агентів ШІ – управління даними.

Стратегічний вибір часу: Nvidia RTX Spark та нові процесори Intel

Час демонстрації не є випадковим. Computex 2026 був домінований однією темою: ШІ на пристрої. За кілька годин до ключової промови Intel генеральний директор Nvidia, Дженсен Хуанг, представив RTX Spark – новий суперчіп на базі архітектури Arm, який компанія позиціонує як основу для нового покоління ПК з підтримкою ШІ.

RTX Spark Superchip пропонує до 20 ядер процесора Arm, графічний процесор Blackwell з 6144 ядрами CUDA, 128 ГБ оперативної пам’яті LPDDR5X та пропускну здатність пам’яті до 300 ГБ/с. Цих потужностей достатньо для роботи AI-агентів та моделей з 120 мільярдами параметрів із довжиною контексту до мільйона токенів. Системи на базі RTX Spark надійдуть у продаж восени.

Intel, у свою чергу, представила процесори Xeon 6+ з 288 енергоефективними ядрами, створені за технологією 18A для центрів обробки даних, а також позиціонувала свої Core Ultra Series 3 як клієнтські рішення, що роблять гібридний інференс можливим на ПК.

Гібридний оркестратор Perplexity знаходиться на перетині обох стратегій. Якщо система працюватиме, як заявлено, вона створить прямий економічний стимул для користувачів та компаній інвестувати в потужніші локальні процесори. Чим більш функціональний чіп на пристрої, тим більше інференсу може виконуватися локально, зменшуючи витрати на хмарні сервіси та підвищуючи швидкість обробки конфіденційних завдань. Ця динаміка вигідна Nvidia, Intel та іншим виробникам чіпів, що конкурують за ринок AI PC.

Наслідки виходять за межі економіки чіпів. «Зі зростанням потужності процесорів, більше інтелекту переміщується на машини користувачів, доповнюючи хмарний інференс для складних завдань, які все ще потребують передових моделей», – повідомив представник Perplexity. «Конфіденційна та суверенна робота може залишатися локальною, що змінює потребу в масштабній інфраструктурі на державному рівні».

Останнє твердження – про суверенну інфраструктуру – є найбільш провокативним. Країни від ОАЕ до Франції та Індії інвестують мільярди у власні обчислювальні потужності ШІ, частково виходячи з припущення, що конфіденційні дані мають залишатися в межах їхніх кордонів. Якщо значна частина інференсу може виконуватися на пристрої кінцевого користувача без передачі даних, це змінює розрахунки. Це не усуває потребу в центрах обробки даних, але може знизити терміновість їх розбудови.

Архітектура, незалежна від моделей, що уможливлює гібридний інференс

Гібридний підхід Perplexity базується на тій самій архітектурній стратегії, яку компанія реалізує весь рік: шар оркестрації важливіший за окремі моделі. Для інженерів ШІ це означає фундаментальний зсув – шар оркестрації може стати важливішим за самі моделі.

Ключова ідея – поділ відповідальності: шар оркестрації керує декомпозицією завдань, управлінням станом та координацією інструментів, тоді як шар моделей відповідає за конкретні обчислення. Таке розділення дозволяє легко замінювати моделі на більш ефективні, не переробляючи всю систему.

Perplexity активно дотримується цієї філософії, інвестуючи в інтеграцію передових моделей у зручний для користувача інтерфейс. Компанія вважає, що цінність полягає в оркестрації різноманітних сторонніх мовних моделей (LLMs) для отримання найефективніших та найточніших відповідей. На думку Perplexity, моделі спеціалізуються, а не стають універсальними.

Розширення гібридного інференсу виводить цю логіку на новий рівень. Perplexity тепер оркеструє не лише між моделями, а й між фізичними обчислювальними середовищами, вибираючи, де виконувати кожну модель. Легковагова локальна модель може обробляти завдання з узагальнення тексту, яке потребує високого рівня конфіденційності, тоді як передова хмарна модель може аналізувати цей результат у контексті ширшого ринкового ландшафту. Оркестратор керує цим переходом.

Це технічно амбітна заява. Для надійної роботи в реальних умовах оркестратор повинен точно оцінювати складність кожного підзавдання, розуміти рівень конфіденційності даних, знати можливості та характеристики локального обладнання користувача, а також керувати станом завдання, яке може переміщатися між середовищами під час виконання.

Легко уявити граничні випадки, коли логіка маршрутизації дає збій, відправляє щось конфіденційне до хмари або знижує продуктивність, призначаючи завдання недостатньо потужній локальній моделі. Perplexity стверджує, що система буде незалежною від конкретного виробника чіпів, хоча початкова демонстрація на Computex працювала на обладнанні Intel. Компанія висловила ентузіазм щодо нових AI-чіпів, анонсованих на виставці, що свідчить про намір оптимізувати роботу для різних постачальників.

Оцінка в 20 мільярдів доларів, дев’ять судових позовів та тиск результатів

Анонс гібридного інференсу відбувається в складний для Perplexity період. Компанія демонструє видатне зростання: вона залучила 200 мільйонів доларів нових інвестицій при оцінці в 20 мільярдів доларів, через два місяці після залучення 100 мільйонів доларів при оцінці в 18 мільярдів доларів. З моменту заснування три роки тому, компанія залучила загалом 1,5 мільярда доларів, згідно з даними PitchBook.

Однак компанія також стикається зі зростаючою кількістю юридичних викликів. Станом на 31 травня 2026 року, дев’ять організацій подали позови проти Perplexity щодо порушення авторських прав та торговельних марок: CNN, The New York Times, News Corp та Dow Jones, The New York Post, The Chicago Tribune, Encyclopedia Britannica, Merriam-Webster, Reddit, а також японська Yomiuri Shimbun. Позов CNN, поданий 28 травня, звинувачує Perplexity у викраденні понад 17 000 історій, фотографій, відео та іншого контенту CNN для навчання своїх продуктів. Perplexity відповідає послідовною позицією: «Факти не можна захистити авторським правом», – заявив директор з комунікацій компанії Джессі Двайєр.

Інші видавці обрали партнерство замість судових розглядів. Time, Gannett, Le Monde та Der Spiegel підписали ліцензійні угоди з Perplexity. Компанія запустила програму Publishers Program у середині 2024 року, згідно з якою видавництва-учасники отримують частку доходу, що генерується від цитування їхнього контенту у відповідях Perplexity.

За даними CNBC, директор з бізнесу Perplexity Дмитро Шевеленко підтвердив, що фіксована ставка становить двозначний відсоток, але відмовився надати деталі. Як повідомляв TechCrunch у грудні 2024 року, до програми приєдналися додаткові видавці, включаючи LA Times, Adweek, The Independent та Lee Enterprises, хоча це викликало внутрішні суперечки – журналісти деяких видань повідомили TechCrunch, що їх не було поінформовано про угоди до їхнього публічного оголошення.

Юридичні ризики не є екзистенційними, але вони матеріальні. Зважаючи на те, що підприємства все частіше розглядають інструменти Perplexity для роботи з конфіденційними даними – саме той сценарій використання, на який розрахована система гібридного інференсу – невирішені питання інтелектуальної власності можуть сповільнити впровадження.

Як гібридний інференс посилює корпоративні амбіції Perplexity

Демонстрація гібридного інференсу повинна розглядатися у контексті ширшого виходу Perplexity на ринок корпоративного програмного забезпечення, що значно прискорився цього року. На конференції розробників Ask 2026 у березні VentureBeat повідомляв, що Perplexity анонсувала Computer for Enterprise, позиціонуючи трирічний стартап як прямого конкурента Microsoft, Salesforce та традиційним корпоративним програмним рішенням.

На додаток до 100+ інтеграцій Computer, корпоративні клієнти отримали доступ до бізнес-класу конекторів для Snowflake, Datadog, Salesforce, SharePoint та HubSpot. Адміністратори можуть встановлювати власні конектори через Model Context Protocol. Пакет також включає спеціалізовані шаблони робочих процесів для аналізу юридичних контрактів, підтримки фінансового аудиту, підготовки до продажів та сортування запитів служби підтримки, а також сертифікацію SOC 2 Type II та опцію нульового збереження даних.

Гібридний інференс значно посилює цю пропозицію для корпоративного сегменту. Для регульованих галузей – фінансові послуги, охорона здоров’я, оборона, юриспруденція – можливість зберігати конфіденційні дані на локальному пристрої, зберігаючи при цьому потужність передових хмарних моделей, є не просто бажаною, а потенційною вимогою для дотримання нормативних актів.

Інвестиційний банк, що обробляє конфіденційні документи угод, може бути не в змозі передати ці матеріали до сторонньої хмари згідно з чинними угодами про обробку даних. Система, яка може локально обробляти конфіденційні дані, а завдання аналізу, що не потребують конфіденційності, надсилати до хмари, пропонує компромісний шлях. IDC прогнозує десятикратне зростання використання агентів та тисячократне зростання вимог до інференсу до 2027 року. Безпека та управління даними є ключовими факторами при оцінці корпоративних платформ агентів, згідно з опитуванням CrewAI. Гібридний інференс безпосередньо відповідає цим пріоритетам.

Гонка за те, де саме буде виконуватися ШІ, тільки починається

Кілька питань визначатимуть, чи стане демонстрація Perplexity на Computex знаковим продуктом, чи лише цікавим прототипом.

Реальні характеристики продуктивності ще не випробувані поза контрольованим середовищем сцени – як логіка маршрутизації буде справлятися з різними конфігураціями обладнання, нестабільними мережевими з’єднаннями та неоднозначною класифікацією конфіденційності даних, залишається відкритим питанням.

Важливою є і реакція конкурентів: Google, Microsoft, Apple та OpenAI розробляють власні локально-хмарні архітектури ШІ. Apple Intelligence вже маршрутизує деякі завдання локально, а деякі – на сервери Private Cloud Compute; Gemini Nano від Google працює на пристрої; а ПК Microsoft Copilot+ створені для локального інференсу. Однак жодна з цих систем наразі не пропонує такого динамічного, автономного маршрутизування завдань на рівні окремих задач, як продемонструвала Perplexity.

Крім того, існує бізнес-аспект. Щорічний дохід Perplexity (ARR) у березні 2026 року перевищив 450 мільйонів доларів, порівняно з приблизно 200 мільйонами доларів шістьма місяцями раніше. Це швидке зростання, але при оцінці понад 20 мільярдів доларів компанія торгується з премією, що вимагає трансформації технології у стійке впровадження в корпоративному сегменті.

Perplexity будувала свій бізнес на припущенні, що майбутнє належить не будь-якій окремій моделі, а системі, яка їх усі оркеструє. На Computex компанія поширила цю ставку з програмного рівня на фізичний – від моделі до машини. У невпинній гонці індустрії ШІ за будівництвом більших центрів обробки даних та тренуванням більших моделей, Perplexity стверджує, що найважливішим комп’ютером у стеку може бути той, який вже стоїть на вашому столі.

Прогноз ІТ-Блогу: Система гібридного інференсу Perplexity має потенціал трансформувати ринок AI PC, зміщуючи фокус з суто хмарних рішень на більш збалансовані підходи. Очікується, що найближчим часом конкуренти впровадять аналогічні рішення, що посилить конкуренцію у сегменті персональних AI-асистентів та стимулюватиме подальший розвиток локальних обчислень.

Подробиці можна знайти на сайті: venturebeat.com

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *