Голосові асистенти, подібні до Alexa, надзвичайно зручні, проте вони мають низку суттєвих недоліків. Одним із найсерйозніших є надсилання ваших голосових записів до хмари для обробки. Причому деякі з цих записів могли прослуховувати сторонні підрядники, найняті для оцінки якості відповідей смарт-колонок. Якщо ви прагнете мати смарт-колонку, яка не втручається у вашу приватність, завжди є можливість створити власну.
Адам Девідсон
Створіть власного голосового асистента
Alexa, ти звільнена!
Якщо вам набридло залежати від Alexa чи Google Home для голосового керування розумним будинком, першим кроком має стати заміна апаратного забезпечення. Популярність смарт-колонок Amazon Echo та Google Home зумовлена їхньою відносно невисокою вартістю. Однак, для заміни вам зовсім не обов’язково витрачати значні кошти.
Найпростішим рішенням є придбання готової смарт-колонки, наприклад, Home Assistant Voice Preview Edition. Її вартість становить 69 доларів (приблизно 2 600 гривень за курсом 2026 року). Після підключення до Home Assistant Cloud, ви зможете миттєво почати використовувати голосові команди за допомогою асистента Assist для керування вашим розумним будинком.
Якщо ж ви бажаєте експериментувати з меншими витратами, спробуйте сконструювати власну смарт-колонку. Я придбав комплект reSpeaker Lite Voice Assistant Kit від Seeed Studio. Він включає плату з аудіо- та голосовою обробкою, масив з 2 мікрофонів, 5-ватний динамік та корпус. Можна придбати плату з попередньо припаяним ESP32, що дозволяє підключити її до Home Assistant через ESPHome. Таким чином, вам залишиться лише з’єднати компоненти, прошити мікропрограму та зібрати корпус.
Хоча це, можливо, не найестетичніша смарт-колонка на ринку, її продуктивність вражає. Вона здатна розпізнавати ключове слово, навіть коли поруч грає музика з потужних колонок. Використовуючи Home Assistant Cloud для обробки, я можу вмикати та вимикати світло за допомогою голосових команд приблизно за секунду. Це більш ніж достатньо для моїх потреб.
Налаштуйте Whisper та Piper для локального голосового керування
Немає потреби залежати від хмари
Home Assistant Cloud — це зручний інструмент для обробки вашого голосу за допомогою функцій перетворення мови на текст (Speech-to-Text, STT) та генерації мовних відповідей за допомогою перетворення тексту на мову (Text-to-Speech, TTS). Однак, якщо ви прагнете створити повністю локальну смарт-колонку, яка не залежить від хмарних сервісів, ви можете налаштувати власні STT та TTS.
У Home Assistant ви можете використовувати відкриту модель розпізнавання мови Whisper для транскрибування ваших голосових команд у текст. Нейронна система перетворення тексту на мову Piper може брати згенерований у Home Assistant текст і перетворювати його на мову, яку можна відтворити через вашу смарт-колонку.
Home Assistant використовує протокол Wyoming для зв’язку голосового обладнання з Whisper та Piper. Це дозволяє вам використовувати вашу смарт-колонку повністю локально, з виявленням ключового слова, перетворенням мови на текст та перетворенням тексту на мову, що відбувається на вашому власному обладнанні.
Швидкість відповіді вашої смарт-колонки залежатиме від використовуваного обладнання. Ви можете запустити Whisper та Piper на Raspberry Pi 4, використовуючи менші моделі, але можлива затримка у кілька секунд до отримання відповіді. З Raspberry Pi 5 або Home Assistant Green ця затримка може значно зменшитися, а на потужнішому обладнанні час відгуку може бути меншим за секунду.
Додайте n8n до вашої конфігурації голосового асистента
Зробіть вашого голосового асистента ще потужнішим
За замовчуванням ваша смарт-колонка використовуватиме стандартні команди асистента Assist. Хоча вони корисні для таких завдань, як увімкнення/вимкнення світла та інші команди для розумного будинку, Assist не має такого потужного оброблення природної мови, як великі мовні моделі (LLM). Тому для успішного виконання команд вам, можливо, доведеться дотримуватися обмежених варіацій формулювань.
Ви можете наділити ваш голосовий асистент можливостями розуміння природної мови, підключивши його до LLM, розташованої у хмарі або розміщеної локально. LLM виступатиме як розмовний агент, який відповідає за розуміння намірів ваших висловлювань. Це зробить вашу смарт-колонку набагато “розумнішою” і схожою на комерційні аналоги.
Якщо ви хочете зробити свою смарт-колонку ще потужнішою, можна підключити її до платформи автоматизації, такої як n8n. Тоді ви зможете використовувати голос для запуску автоматизацій n8n, які взаємодіють з іншими сервісами. Найкраще те, що n8n можна розмістити самостійно, зменшуючи обсяг даних, які виходять з вашої домашньої мережі.
Я використовую Notion для різноманітних завдань, зокрема для відстеження музики, серіалів та фільмів, які я хочу переглянути чи прослухати. Підключивши n8n до Home Assistant, я можу попросити свою смарт-колонку додати телешоу до мого списку перегляду, і n8n внесе відповідне шоу до моєї бази даних відстеження медіа, включаючи обкладинку та стрімінговий сервіс, на якому воно доступне.
Гарна локальна смарт-колонка – це вже не мрія
Такі компанії, як Amazon та Google, продають смарт-колонки за відносно низькими цінами, оскільки це чудовий спосіб залучити користувачів до їхніх екосистем. Раніше локальні смарт-колонки не могли конкурувати з хмарними голосовими асистентами, але цей розрив скоротився. Моя самостійно зібрана смарт-колонка виконує майже все, що мені потрібно, без підписок, реклами та сторонніх компаній, які б слухали все, що я говорю.
Порада від Soft Portal: Ця новина надає цінну інформацію для користувачів, які стурбовані приватністю своїх даних або прагнуть максимального контролю над своїми пристроями. Самостійне створення смарт-колонки з локальною обробкою даних дозволяє уникнути багатьох недоліків комерційних рішень, надаючи повну безпеку та гнучкість у налаштуванні.
Джерело новини: www.howtogeek.com
