На цьогорічній конференції Google I/O розробники отримали можливість коротко ознайомитися з майбутніми окулярами Google, що працюють на базі штучного інтелекту. Йдеться не про суто аудіо-окуляри, які компанія планує випустити восени, а про пристрій, що поєднує аудіо та візуальний досвід.
Новітні окуляри: Поєднання реальності та інформації
Ці окуляри Android XR, анонсовані минулого року, оснащені дисплеєм в лінзі, який проєктує корисну інформацію прямо перед очима користувача, накладаючи її на реальний світ. Серед таких функцій – віджети з прогнозом погоди, навігаційними підказками для пішоходів, даними про замовлення Uber, синхронним перекладом і навіть власноруч створеними за допомогою ШІ віджетами.

Компанія також зазначила, що окуляри будуть сумісні як з iOS, так і з Android смартфонами, як у аудіо-форматі, так і в майбутній версії з дисплеєм.
Окуляри з дисплеєм є наступним кроком після першого покоління аудіо-окулярів, що надійдуть у продаж пізніше цього року. Розробка велася у співпраці з Warby Parker, Gentle Monster та Samsung, поєднуючи технології Google з дизайнерською естетикою брендів.
Прототип проти готового продукту
Окуляри, які тестувалися, були ще значною мірою прототипом, хоч і достатньо відшліфованим для зовнішнього тестування. Представники, які демонстрували XR-окуляри, пояснили, що прототип дозволив Google не турбуватися про косметичні деталі, пов’язані з різними стилями та формами, а зосередитися на експериментах з технологією дисплея та її впливом на час роботи від батареї. Це означає, що ці окуляри суттєво відрізняються від будь-якої майбутньої версії, що надійде в продаж, з точки зору посадки, форми, розмірів та уваги до деталей. Скоріше, це можливість експериментувати з “нутрощами” окулярів, зберігаючи базову, зручну оправу.
Версія окулярів, що надійде в продаж, зможе розпізнавати, коли окуляри надягають або знімають, але протестований прототип не мав цієї функції.

Щоб активувати Gemini, потрібно натиснути на праву частину оправи окулярів протягом двох секунд. Почуєте стартовий сигнал, який сповістить про активацію Gemini та готовність до прослуховування. У демонстраційній версії запуск Gemini одночасно активував камеру, але кінцева версія дозволить користувачеві налаштувати, чи бажає він вмикати камеру під час запуску Gemini.
Перші враження від функціоналу
У першому тесті було відтворено музику через окуляри, попросивши Gemini увімкнути улюбленого виконавця. Через надмірний шум у приміщенні оцінити якість звуку було складно, оскільки музика грала на максимальній гучності, але її все ще було важко розрізнити чітко та детально. Проте, перше враження від обмеженого досвіду полягало в тому, що окуляри не стануть повноцінною заміною високоякісних навушників, але можуть бути корисними для фонової музики під час прогулянок, походів або домашніх справ. Перевага відсутності навушників полягає в тому, що ви можете легше чути співрозмовника, на відміну від режимів прозорості на таких пристроях, як AirPods від Apple.
Щоб вимкнути музику, слід один раз торкнутися середньої частини оправи, ніби торкаючись скроні.

У другому тесті було використано кнопку захоплення фото для створення знімка людини. Дисплей був вимкнений, тому зображення було передано на телефон і годинник. (Згодом з’явиться можливість записувати відео тривалим натисканням, але ця опція була недоступна для тестування з прототипом. У випадку відео, замість фото ви бачитимете попередній перегляд мініатюри відео.)
Також можна просто попросити Gemini зробити фото без натискання кнопки, і виконати певну ШІ-маніпуляцію з результатом. Наприклад, можна сказати: “Зроби фото і перетвори людину на аніме-персонажа”. Фото надсилається на телефон, потім на сервери Gemini та Nano Banana, а потім повертається у відредагованій версії.
На заході Google I/O, де Wi-Fi був перевантажений, повний цикл обробки зайняв близько 45 секунд.

Досвід використання дисплея та навігації
З увімкненим дисплеєм у полі зору з’являється простий головний екран. Демо-версія мала кілька попередньо завантажених віджетів, що показували погоду та зворотний відлік до події Google I/O. Також можна було створювати швидкі запуски для специфічних застосунків, таких як Google Maps або Translate, якщо вони були серед основних сценаріїв використання окулярів.
Прототип мав лише один дисплей над правим оком, але платформа може підтримувати як одинарні, так і подвійні дисплеї, а також суто аудіо-окуляри. Саме зображення було трохи розмитим, але це списали на контактні лінзи з індивідуальними діоптріями, що передбачають носіння однієї лінзи, оптимізованої для зору вдалину, а іншої – для зору зблизька. Коли одне око було заплющене, зображення ставало чіткішим, але досвід майже одразу викликав напругу над правим оком, і неясно, чи була це повністю провина діоптрій.

Одним з найкращих демо була демонстрація функції перекладу мови, яка підтримується додатком Google Translate на телефоні. Один з демонстраторів швидко говорив іспанською, і окуляри автоматично розпізнали мову та відобразили текст англійською на дисплеї, а Gemini озвучував англійську в аудіо. Можна було бачити, як мандрівники придбають окуляри виключно заради цієї функції.
Варто зазначити, що Translate працюватиме і на суто аудіо-окулярах, просто текст не буде відображатися на окулярах. Натомість, за потреби, можна буде бачити транскрипцію на телефоні, на додаток до аудіо-зворотного зв’язку в реальному часі.
Інша демонстрація стосувалася використання окулярів для навігації. Хоча очевидно, що неможливо було вийти на вулицю і покинути приміщення для тестування точності, можна було отримати уявлення про те, як це працює. Ви можете розпочати роботу з Google Maps, попросивши Gemini прокласти маршрут до пункту призначення – це може бути навіть щось настільки невизначене, як “найближча кав’ярня”.
Gemini активує Google Maps на телефоні, і після короткої затримки на завантаження досвіду, окуляри відображатимуть покрокові інструкції. Коли ви дивитеся вперед, відображатиметься інформація про наступний поворот. Але якщо вам потрібно орієнтуватися в просторі, подивіться вниз на землю, щоб побачити свою синю крапку на карті. Ви також можете повернути ліворуч і праворуч, щоб обертати в просторі, так само, як ви намагаєтеся змусити синю крапку вказувати правильний шлях на телефоні.
Потім, коли ви знову подивитеся вгору, ви зможете йти далі, не відволікаючись на карту.
Оскільки функція прив’язана до Google Maps на вашому телефоні, збережені призначення, такі як “дім” та “робота”, вже будуть доступні.

Ідентифікація об’єктів та ШІ-маніпуляції
Також вдалося коротко скористатися окулярами для ідентифікації різних об’єктів у полі зору та задавання питань про них. Спочатку окуляри мали проблеми з розпізнаванням копії картини Моне на полиці перед нами, але це було пов’язано з тим, що прототип не вмикав камеру автоматично – її довелося знову вмикати з програми. Все ж, знадобилося кілька запитань, перш ніж Gemini, навіть після наближення, щоб сфокусуватися на підписі Моне внизу зліва, заявив, що це схоже на Моне.
Інші тести пройшли гладше: окуляри одразу розпізнали рослину на полиці та відповіли на запитання про різні рецепти в книзі. Проте, це були речі, які можна було зробити сьогодні за допомогою Google Lens (або інших ШІ-моделей, інтегрованих у чат-боти), хоча, мабуть, цікаво робити це, не виймаючи телефон.
Google заявляє, що надасть більше інформації про свої Android XR окуляри з дисплеєм пізніше цього року, коли розширить свою програму довірених тестувальників.

Аудіо-окуляри: Доступний варіант
Тим часом компанія вважає, що аудіо-функціоналу буде достатньо для задоволення потреб деяких користувачів, що, можливо, є розумним способом пояснити той факт, що окуляри з дисплеєм ще не готові, незважаючи на конкуренцію з боку Meta та Snap у цій сфері.
Як і версія з дисплеєм, аудіо-окуляри також надають доступ до Gemini AI від Google, який ви чуєте приватно через динаміки в оправі. Ви можете робити такі речі, як слухати музику через окуляри, натискати кнопку для фотографування, здійснювати дзвінки або отримувати доступ до додатків телефону з цих окулярів, як і з майбутніми версіями з дисплеєм.
Доступ до інших сторонніх додатків не входив до списку демонстрованих функцій, але окуляри дозволятимуть користувачам давати Gemini команди на кшталт: “Візьми інгредієнти з цього рецепту і додай їх до мого списку покупок”.
В іншому прикладі, який Google продемонстрував під час ключової доповіді заходу, окуляри могли бачити страву, яку носій готував на плиті, і надавати зворотний зв’язок щодо страви, наприклад, чи готова м’ясо.
Думка ІТ-Блогу: Google робить значний крок до інтеграції ШІ в повсякденне життя через носимі пристрої, зосереджуючись на функціональності та зручності. Хоча прототип має певні недоліки, потенціал окулярів з розширеним функціоналом та ШІ-асистентом є величезним, відкриваючи нові горизонти для взаємодії людини з цифровим світом.
Інформація підготовлена на основі матеріалів: techcrunch.com
