DeepL запустила переводчик устной речи в реальном времени — с поддержкой русского

Немецкая компания DeepL представила в своём онлайн-переводчике новую функцию DeepL Voice, ориентированную на использование в живых беседах и видеоконференциях. Теперь пользователи могут переводить устную речь с одного языка на другой и конвертировать в текст в режиме реального времени, сообщает TechCrunch. Этот шаг стал очередным ответом на растущий интерес к сервисам на основе искусственного интеллекта.

Источник изображения: deepl.com

Система машинного перевода DeepL Voice, выполняющая, по мнению самой компании, переводы «беспрецедентно высокого качества», поддерживает 13 языков — английский, немецкий, японский, корейский, шведский, голландский, французский, турецкий, польский, португальский, русский, испанский и итальянский. При этом текстовые субтитры доступны для 33 языков, поддерживаемых платформой.

Новый продукт DeepL может работать как в формате «зеркал», когда переводы отображаются на экране телефона, чтобы участники встречи могли видеть переведённый текст, так и в виде субтитров для видеоконференций. Пока DeepL Voice поддерживает интеграцию только с Microsoft Teams, что, по словам основателя компании Ярека Кутыловского (Jarek Kutylowski), на самом деле покрывает большую часть их клиентской базы. О поддержке других сервисов, таких как Zoom или Google Meet, информации пока нет.

Кутыловский отметил, что DeepL Voice является первым шагом компании в области голосовых технологий, и планируется дальнейшее развитие продукта. Он подчеркнул, что голосовой перевод занял одно из ключевых направлений, которое будет активно развиваться в ближайшие годы, при этом DeepL продолжит улучшать качество своих переводов, разрабатывая собственные ИИ-модели, благодаря которым возможно достичь более высокой точности, особенно в режиме реального времени.

Глава компании также рассказал о возможных сценариях использования новой функции. Например, в сфере обслуживания, где сотрудники ресторанов, кафе и отелей смогут общаться с клиентами, говорящими на разных языках. Что же касается конфиденциальности данных, ведь обработка голосов пользователей происходит на серверах компании, Кутыловский заверил, что DeepL не сохраняет и не использует аудиозаписи для обучения своих моделей, а также соблюдает все требования GDPR и других нормативных актов.

Стоит отметить, что DeepL не единственная компания, работающая над подобными решениями. Google и другие стартапы, такие как Eleven Labs и Panjaya, также разрабатывают сервисы голосового перевода с конвертацией аудио в текст.

Источник: