Google представив ШІ-агента: він напише листа, відстежить пошту та витратить ваші гроші

Google представила Gemini Spark — персонального ШІ-агента, здатного працювати цілодобово: складати електронні листи, формувати документи, моніторити скриньки вхідних повідомлень і навіть здійснювати покупки, навіть коли ваш комп’ютер закритий, а телефон заблокований.

Це анонсоване на Google I/O 2026 оголошення є найамбітнішою спробою компанії перетворити свій ШІ-помічник з інструменту, що відповідає на запитання, на систему, що автономно виконує завдання. Воно також з’являється в період надзвичайної конкуренції, коли Microsoft, OpenAI, Anthropic та Apple змагаються у створенні систем ШІ, які не просто ведуть діалог, а діють — виконуючи багатоетапні робочі процеси зі зменшенням людського нагляду.

“Ми перебуваємо на тому етапі циклу, коли люди хочуть бачити реальну цінність у продуктах, якими вони користуються щодня”, — заявив Сундар Пічаї, генеральний директор Google та Alphabet, під час прес-брифінгу напередодні ключової доповіді. З Spark, стверджував він, ця цінність полягає в агенті, який ніколи не припиняє працювати. Він функціонує цілодобово в хмарі Google, тому “вам не потрібно тримати ноутбук відкритим, щоб переконатися, що він працює”.

Продукт з’являється на переломному етапі для технологічної галузі, оскільки Google, Microsoft, OpenAI, Anthropic та Apple змагаються у створенні систем ШІ, які не просто спілкуються, а *роблять* — виконуючи багатоетапні робочі процеси зі зменшенням людського нагляду. Це також викликає нагальні питання щодо довіри, контролю витрат та того, що станеться, коли агент штучного інтелекту неправильно інтерпретує намір користувача.

Spark почне розгортатися цього тижня для невеликої групи довірених тестувальників, а бета-версія запланована для передплатників Google AI Ultra в Сполучених Штатах наступного тижня.

Архітектура хмарної системи, що дозволяє Gemini Spark працювати, поки ви спите

На відміну від традиційних ШІ-помічників, які активуються лише за запитом, Gemini Spark має іншу архітектуру. Він постійно працює на інфраструктурі Google Cloud, використовуючи нову модель Gemini 3.5 Flash від компанії та те, що Google називає системою агентського керування Antigravity — ту саму базову систему, що забезпечує роботу внутрішніх інструментів розробників компанії.

Практично це означає, що Spark може прийняти складну інструкцію — “надішли моєму керівнику оновлення статусу, витягнувши останні дані з нашої спільної електронної таблиці та часової шкали проекту з нашої презентації Slides” — а потім виконати її в кількох додатках Google без подальшого втручання. Агент може витягувати контекст з електронних листів, документів та записів календаря, синтезувати інформацію та створювати кінцевий результат.

Джош Вудворд, віце-президент Google Labs, Gemini App та AI Studio, описав цей досвід надзвичайно образно під час брифінгу: “Коли ви це використовуєте, це майже схоже на те, як ви щось перекидаєте через плече — Spark це ловить і виконує завдання”.

Хмарна архітектура є свідомим вибором дизайну. Оскільки Spark працює на віддалених серверах, а не на пристрої користувача, він може продовжувати виконувати завдання після того, як користувач відійде. Студент міг би попросити Spark створити посібник для навчання, який оновлюється сам, коли надходять нові завдання від викладача. Власник малого бізнесу міг би доручити йому стежити за його поштою та позначати потенційні запити клієнтів. Батько міг би делегувати логістику сусідського свята — відстежувати відповіді, координувати внески, шукати місця. Це не гіпотетичні сценарії. Вудворд сказав, що вони відображають те, як ранні тестувальники насправді використовували продукт.

Протягом наступних місяців Google планує значно розширити можливості Spark. Компанія впровадить з’єднання MCP (Model Context Protocol) для більш ніж 30 сторонніх партнерів, включаючи Canva, OpenTable та Instacart. Користувачі також зможуть безпосередньо надсилати повідомлення Spark, створювати власні під-агентів для спеціалізованих завдань та підключати Spark до Chrome для дій у веб-браузері. Пізніше цього року новий інтерфейс Android під назвою Android Halo надасть в режимі реального часу видимість того, над чим працює Spark, відображаючи це у верхній частині екрану телефону користувача.

Google порівнює свої запобіжники щодо витрат на ШІ з наданням підлітку першої дебетової картки

Попри всю свою амбітність, Spark стикається з фундаментальною проблемою, яка мучила кожного ШІ-агента до сьогодні: як довірити автономній системі діяти від вашого імені — особливо коли йдеться про гроші?

Google усвідомлює цю проблему. На запитання під час прес-брифінгу, як Spark уникне несанкціонованих покупок, Вудворд використав разючу за своєю відвертістю аналогію. “У команді ми часто думаємо про це як про те, ніби ви даєте підлітку його першу дебетову картку — є певні обмеження та запобіжники, і саме так ми будемо розробляти Spark протягом року”, — сказав він.

На момент запуску Spark не буде самостійно здійснювати покупки. Користувачам надаватимуться явні можливості для перегляду та затвердження будь-якої транзакції перед її завершенням. Але Google побудував інфраструктуру для більш автономного майбутнього. Відія Шрінівасан, яка очолює команди Google з реклами та комерції, представила Agent Payments Protocol, або AP2 — систему, призначену для того, щоб ШІ-агенти могли здійснювати безпечні покупки в межах, визначених користувачем.

Концепція працює наступним чином: користувач повідомляє своєму агенту конкретні бренди, продукти та ліміти витрат, з якими він погоджується. Якщо критерії дотримані, агент може автоматично завершити покупку. AP2 створює, як описує Google, прозорий, підтверджуваний зв’язок між користувачем, продавцем та платіжними процесорами, використовуючи технології, що зберігають конфіденційність, та захищені від несанкціонованого доступу цифрові мандати, щоб гарантувати, що агент діє відповідно до своїх повноважень. AP2 також генерує постійний цифровий слід, тому, якщо потрібне повернення, користувач і продавець дивляться на той самий запис. Google планує впровадити AP2 у свої продукти протягом наступних кількох місяців, починаючи з Gemini Spark.

Система базується на Universal Commerce Protocol (UCP), відкритому стандарті, про який Google оголосив раніше цього року, що надає агентам і комерційним системам спільну мову протягом усього купівельного шляху. До складу Tech Council UCP тепер входять Amazon, Meta, Microsoft, Salesforce та Stripe — видатна коаліція, що підкреслює, наскільки серйозно галузь ставиться до перспективи комерції, керованої агентами.

Google також анонсував Universal Cart — інтелектуальний кошик покупок, який працює між продавцями та сервісами Google. Користувачі можуть додавати товари під час перегляду в Пошуку, спілкування з Gemini, перегляду YouTube або читання Gmail. Кошик потім працює у фоновому режимі — відстежує зниження цін, пропонує вигідні пропозиції на основі бонусів платіжних карток і навіть визначає несумісність продуктів. Інфраструктура покупок розгортається в США цього літа через Пошук та додаток Gemini, а YouTube та Gmail будуть додані пізніше.

Як Google, OpenAI, Microsoft, Anthropic та Apple змагаються у створенні остаточного ШІ-агента

Анонс відбувається в розпал найінтенсивнішого конкурентного періоду в історії ШІ. Google, Microsoft, OpenAI, Anthropic та Apple змагаються у випуску автономних агентів, які можуть виконувати реальну роботу — і кожен робить принципово іншу архітектурну ставку на те, як цього досягти.

OpenAI нещодавно об’єднала свої операційні та глибокі дослідницькі можливості в агента ChatGPT — систему, яка поєднує взаємодію з веб-сайтами, синтез інформації та розмовний інтелект. Вона виконує завдання, використовуючи власний віртуальний комп’ютер, перемикаючись між міркуваннями та діями для виконання складних робочих процесів. Компанія наголошує, що користувачі залишаються під контролем, а ChatGPT запитує дозвіл перед здійсненням відповідальних дій. Але продукт стикався з перевіркою надійності. Агент ChatGPT, що використовує комп’ютер OpenAI, отримує 38,1% на OSWorld, галузевому бенчмарку для завдань комп’ютерного використання, тоді як люди отримують понад 72%.

Anthropic запустив свого агента Claude Computer Use Agent у дослідницькому попередньому перегляді в березні, надавши Claude можливість бачити, навігувати та керувати робочим столом користувача — натискати кнопки, відкривати програми, заповнювати електронні таблиці та виконувати багатоетапні робочі процеси. Claude Cowork автономно виконує завдання — користувачі ставлять йому мету, і Claude працює на їхньому комп’ютері, з локальними файлами та додатками, щоб надати готовий результат. Anthropic агресивно ітерував, нещодавно випустивши десять попередньо розроблених фінансових агентів та прагнучи до глибокої інтеграції з Microsoft 365.

Microsoft представив Copilot Cowork, щоб вийти за межі чату та перейти до виконання — допомагаючи користувачам делегувати реальні завдання та виконувати їх. Cowork працює в хмарі, що означає, що користувачам не потрібно турбуватися про закриття ноутбука. Система базується на Work IQ — інтелектуальному рівні Microsoft, який розуміє організаційні дані, інструменти та структуру. Цей крок перетворює Copilot із помічника на бічній панелі на оркестратора автономних агентів.

Apple також готує оновлену Siri до WWDC 2026, яка діятиме як “завжди увімкнений агент”, здатний виконувати завдання в різних додатках, використовуючи персональні дані. Моделі Gemini від Google допомагатимуть працювати оновленій Siri завдяки багаторічній угоді, яка, за повідомленнями, коштує Apple близько 1 мільярда доларів на рік.

Збіг очевидний: кожна велика платформа переходить від помічників, які говорять, до агентів, які діють. Але кожна підходить до проблеми по-різному. Агент OpenAI працює переважно через браузер. Агент Anthropic працює безпосередньо на робочому столі користувача. Агент Microsoft тісно пов’язаний з екосистемою Office 365. Агент Apple наголошує на обробці на пристрої та конфіденційності. Підхід Google зі Spark вирізняється своєю ставкою на хмарну стійкість та глибоку інтеграцію з власними сервісами.

Замість того, щоб керувати екраном користувача піксель за пікселем, Spark працює через структуровані інтеграції — власні API Workspace від Google, і все частіше, сторонні підключення через MCP. Перевага полягає в надійності та швидкості: структуроване використання інструментів набагато передбачуваніше, ніж читання екрана. Недолік полягає в тому, що Spark, принаймні спочатку, може діяти лише в системах, до яких він був підключений.

ШІ-модель, що стоїть за Spark, обробляє трильйони токенів на день — і Google стверджує, що це може заощадити підприємствам мільярди

Можливості Spark невіддільні від моделі, що його рухає. Gemini 3.5 Flash, також анонсована в понеділок, — це нова робоча конячка Google у сфері ШІ, спеціально розроблена для вимог агентських робочих процесів.

Заяви про продуктивність важливі. Google стверджує, що 3.5 Flash перевершує свою попередню передову модель Gemini 3.1 Pro майже за всіма бенчмарками, працюючи в чотири рази швидше, ніж порівнянні передові моделі з точки зору токенів виводу за секунду. Ще більш оптимізована версія, доступна в платформі розробки Antigravity від Google, працює в дванадцять разів швидше.

Пічаї прямо окреслив економічний аспект. Компанії, які обробляють приблизно один трильйон токенів на день у Google Cloud — цифра, яку, за його словами, досягають провідні корпоративні клієнти — могли б заощадити понад 1 мільярд доларів щорічно, перевівши 80% своїх робочих навантажень на комбінацію моделей Flash та передових моделей, таких як 3.5 Pro. На ринку, де, як зазначив Пічаї, CIO вже “пропалюють свої річні бюджети на токени, а зараз лише травень”, аргумент вартості може мати таке ж значення, як і аргумент можливостей.

Всередині компанії власні розробники Google споживають Gemini 3.5 Flash у приголомшливому та швидкозростаючому темпі. У березні Google внутрішньо обробляв близько півтрильйона токенів на день. Ця цифра з тих пір зросла до понад трьох трильйонів — подвоюючись приблизно кожні кілька тижнів. Пічаї описав це як “потужний зворотний зв’язок”, який постійно покращує модель.

Корай Кавукчуоглу, технічний директор Google DeepMind та головний архітектор ШІ Google, заявив, що швидкість моделі робить випадки агентського використання практичними. “3.5 Flash особливо добре підходить для одночасного розгортання кількох агентів та виконання тривалих завдань”, — сказав він під час брифінгу, додавши, що Google успішно протестував агентів, які створюють “працюючу операційну систему повністю з нуля”.

Модель 3.5 Pro, більш потужний аналог, наразі тестується внутрішньо і буде випущена наступного місяця.

Вартість Gemini Spark та його місце в нових рівнях підписки Google

Gemini Spark буде доступний для передплатників Google AI Ultra. Компанія одночасно реструктурує свої рівні підписки, щоб зробити технологію більш доступною. Новий план Ultra за 100 доларів на місяць надає ліміт використання в 5 разів вищий, ніж план Pro, а також пріоритетний доступ до Antigravity та 20 ТБ хмарного сховища. Найвищий план Ultra знижується з 250 до 200 доларів на місяць, з лімітом використання в 20 разів вищим та доступом до повного набору можливостей.

Обидва рівні включають Gemini Spark, агент Daily Brief — проактивний ранковий дайджест, який вночі упорядковує електронну пошту, календар та завдання — та доступ до нових моделей Gemini Omni та 3.5 Flash. Ціни позиціонують Spark як преміальний продукт — дорожчий за Claude Pro від Anthropic за 20 доларів на місяць, але порівнянний з вищими рівнями конкуруючих продуктів, таких як Claude Max (100–200 доларів на місяць) та ChatGPT Pro від OpenAI (200 доларів на місяць).

Чому конфіденційність, надійність та прив’язка до екосистеми можуть підірвати амбіції Google у сфері агентів

Ризики реальні та багатовимірні.

Надійність залишається найбільшим викликом галузі. Навіть найкращі ШІ-моделі галюцинують, неправильно інтерпретують інструкції та роблять помилки, які людина ніколи б не зробила. Агент, який складає електронний лист не тій особі, неправильно читає дані з електронної таблиці або надсилає платіж не тому продавцю, може створити наслідки, які важко виправити. Підхід Google, який вимагає явного затвердження для дій з високими ставками, таких як витрачання грошей або надсилання електронних листів, є розумним запобіжником — але це також обмежує, наскільки автономним може бути агент. Агент, який постійно просить підтвердження, — це не зовсім агент.

Конфіденційність — ще одна проблема. Здатність Spark синтезувати інформацію з усієї поштової скриньки Gmail користувача, календаря, документів та історії чатів означає, що він має надзвичайно глибоке уявлення про цифрове життя людини. Google стверджує, що Spark працює в повністю керованому, безпечному середовищі виконання з ізольованими тимчасовими віртуальними машинами, зашифрованими обліковими даними та політиками запобігання втраті даних. Але концентрація особистого контексту в одній ШІ-системі — доступній через природну мову — створює поверхню, яка привертатиме увагу регуляторів, захисників конфіденційності та дослідників безпеки.

Час виходу на ринок також невизначений. Споживчий попит на завжди увімкнені ШІ-агенти ще не доведений у великих масштабах. Google стверджує, що додаток Gemini має 900 мільйонів користувачів на місяць, але незрозуміло, скільки з цих користувачів готові до концептуального стрибка від “задати питання, отримати відповідь” до “делегувати завдання, довіряти результату”. Історія цифрових помічників — від Clippy до раннього Siri та Alexa — насичена продуктами, які обіцяли проактивний інтелект і принесли розчарування.

Існує також питання прив’язки до екосистеми. Spark найкраще працює в межах власних сервісів Google. Хоча з’єднання MCP зі сторонніми додатками розширять його охоплення, початковий досвід — це глибока інтеграція з Workspace. Для мільярдів людей, які живуть в екосистемі Google, це природно. Для тих, хто розділяє своє цифрове життя між Microsoft, Apple та іншими платформами, корисність Spark буде обмеженою — принаймні, спочатку.

Вудворд визнав це, коли його запитали, чи залишиться Spark в екосистемі Google. “Він буде міжплатформним двома способами”, — сказав він — через інтеграції MCP зі сторонніми додатками, а також через доступність на веб, Android та iOS, з синхронізацією завдань між пристроями через хмару.

Справжній тест для Gemini Spark — не в тому, чи зможе він виконати роботу, а в тому, чи дозволять йому це люди

Ставка Google з Gemini Spark полягає в тому, що центр тяжіння індустрії ШІ зміщується від моделей, які мислять, до систем, які діють — і що компанія, яка найкраще позиціонується для перемоги в цій трансформації, — це та, яка має найповніший набір споживчих послуг для дій. Це ставка, підкріплена величезними інвестиціями в інфраструктуру. Google очікує витратити приблизно від 180 до 190 мільярдів доларів на капітальні витрати цього року — приблизно в шість разів більше, ніж у 2022 році — значна частина з яких піде на обчислювальні потужності ШІ, необхідні для масштабування агентів, таких як Spark, для сотень мільйонів користувачів.

Іншими словами, технологія приходить. Моделі достатньо швидкі, інтеграції достатньо глибокі, платіжні шляхи достатньо безпечні. Google створив систему, яка може складати ваші електронні листи, організовувати ваш календар, моніторити вашу пошту, а незабаром і витрачати ваші гроші — все, поки ви спите.

Але найскладніша проблема в штучному інтелекті ніколи не полягала в створенні здатної машини. Вона полягала в тому, щоб зробити людину комфортною. Протягом двох десятиліть основна обіцянка Google — це десять синіх посилань та поле пошуку — транзакція, побудована на припущенні, що користувач контролює ситуацію. Gemini Spark просить користувачів повністю переглянути ці відносини, передати набір ключів системі, яка є блискучою, невтомною і, за власним визнанням її творця, все ще найкраще порівнюється з підлітком з дебетовою карткою.

Gemini Spark виходить для довірених тестувальників цього тижня, а ширша бета-версія для передплатників Google AI Ultra в США очікується наступного тижня.

Прогноз ІТ-Блогу: Gemini Spark стане провідним рішенням для автоматизації рутинних завдань, стимулюючи попит на більш потужні хмарні обчислення та сприяючи розвитку нових стандартів безпеки для ШІ-транзакцій. Його успіх залежатиме від здатності Google переконати користувачів у надійності та безпеці, долаючи природну недовіру до повністю автономних систем.

За матеріалами: venturebeat.com