Стартап Sesame, заснований колишніми співробітниками Oculus та іншими фахівцями з VR-компанії, що перейшла до Meta, представив публічну бета-версію своїх розмовних агентів зі штучним інтелектом. Розробка тривала понад рік, і тепер, завдяки новому застосунку для iOS, Sesame переосмислює класичний досвід взаємодії з чат-ботами, подібними до ChatGPT. Мета – створити систему, де розмова є плавною, навіть якщо ШІ потребує часу на обробку інформації.
Подолання “Долини Жаху” у голосових інтерфейсах
Компанія пояснює, що існує “природна напруга між необхідністю швидко реагувати та бажанням сформулювати продуману відповідь. Повільніша відповідь часто є точнішою, але може здаватися неприродною, якщо триває занадто довго”.
Щоб вирішити цю проблему, Sesame стверджує, що розробила швидкі системи пошуку та отримання даних, які дозволяють ШІ мати актуальну інформацію. Крім того, технологія дає змогу виконувати кілька паралельних пошукових запитів під час розмови, інтегруючи результати у відповіді в реальному часі. Це означає, що ШІ поводитиметься більш подібно до людини, навіть змінюючи хід думки посередині речення, якщо з’являється новіша інформація, як це часто роблять люди, згадуючи важливий факт чи точку зору.
Представлення персоналізованих ШІ-агентів
Застосунок пропонує чотирьох унікальних ШІ-агентів: Maya, Miles, Simone та Charlie. Кожен з них має власний голос, особистість, точку зору та пам’ять. Maya та Miles раніше були доступні в дослідницькому попередньому перегляді технології Sesame, де їх протестували понад мільйон користувачів за перші кілька тижнів, як зазначав інвестор Sequoia. (На той час компанія залучила 250 мільйонів доларів серії B від Sequoia та інших інвесторів і відкривала бета-тестування).
Під час бета-тестування Sesame враховувала відгуки користувачів та впровадила нові функції. Серед них — пошукові картки з візуальними результатами для кращого розуміння концепцій, нотатки для фіксації ключових висновків, режим текстового спілкування для ситуацій, коли голосове введення неможливе, а також підтримка “глибокого занурення” для отримання більш детальних результатів. З’явився також режим інкогніто для приватних розмов, який дозволяє агентам отримувати доступ до попереднього контексту, але не зберігає інформацію в пам’яті.
Майбутні плани та потенціал “агентності”
Застосунок для iOS — це лише перший крок до амбітніших планів Sesame. Компанія планує розробити інтелектуальні окуляри зі штучним інтелектом, запуск яких очікується у 2027 році. Перед цим агенти навчаться не тільки “думати разом з вами”, але й, як натякає Sesame, “діяти від вашого імені”. Саме тому їх називають “агентами”, а не просто чат-ботами.
Це особливо цікаво, адже робота з агентними інструментами сьогодні часто вимагає від користувача чіткого формулювання запиту (промпту) та розуміння бажаного результату, а іноді й шляхів його досягнення. Розмовний агент, з яким можна спілкуватися природно, може допомогти зробити наступні кроки, не вимагаючи від вас ідеального формулювання команди.
Застосунок для iOS вже доступний у 39 країнах і поки що є безкоштовним. Однак, при реєстрації може виникнути невелика черга. У майбутньому компанія планує випустити версію для Android.
Думка ІТ-Блогу: Sesame робить значний крок у напрямку природнішої взаємодії людини та ШІ, розмиваючи межі між чат-ботами та справжніми цифровими помічниками. Ця еволюція може суттєво змінити спосіб, як ми використовуємо технології, роблячи їх більш інтуїтивними та доступними.
Дізнатися більше на: techcrunch.com
