Alibaba представила большую языковую модель, которая отчасти превзошла GPT-4

Компания Alibaba Cloud анонсировала выпуск улучшенной версии своей большой языковой модели Qwen2.5. Новая нейросеть продемонстрировала превосходство над GPT-4 от OpenAI по некоторым параметрам, таким как логические рассуждения и понимание текста.

Источник изображения: Alibaba Cloud

По словам технического директора Alibaba Cloud Цзинжэня Чжоу (Jingren Zhou), новая модель демонстрирует значительные улучшения в области рассуждений, понимания кода и естественного языка по сравнению с предыдущей версией Qwen2.0. Согласно анализу платформы OpenCompass, проведённому в марте, модель Qwen2.5 превосходит GPT-4 от OpenAI по языковым и творческим возможностям. Однако она уступает в таких аспектах, как знания, логические рассуждения и математические способности.

Напомним, большие языковые модели (LLM), к которым относится и Qwen, используются в приложениях искусственного интеллекта. Они обучаются на огромных объёмах данных, чтобы затем генерировать ответы на запросы пользователей на естественном языке. После выхода ChatGPT в 2022 году, вызвавшего ажиотаж во всём мире, компания Alibaba представила Tongyi Qianwen в апреле 2023 года. А в октябре последовал выпуск обновлённой версии с расширенными возможностями понимания сложных инструкций, написания текстов, логических рассуждений и запоминания информации.

По сообщению Alibaba Cloud, сервисами ИИ на базе Qwen, такими как DingTalk (аналог Slack от Alibaba), уже воспользовались более 2,2 млн корпоративных пользователей. Кроме того, компания представила сообществу разработчиков ряд открытых моделей Qwen и модернизировала свою генеративную платформу Model Studio, добавив дополнительные средства для создания ИИ.

В Китае, как и во всем мире, наблюдается бум интереса к чат-ботам и моделям генеративного ИИ. Наряду с Alibaba свои решения выпустили Baidu и Tencent. Например, чат-бот Baidu Ernie к апрелю 2023 года привлёк более 200 млн пользователей после получения разрешения на публичное использование в августе 2022 года.

Компания Alibaba Cloud заявила, что её обновлённая языковая модель Qwen2.5 была развёрнута более чем в 90 000 компаниях разных отраслей, и она намерена дальше сотрудничать с клиентами и разработчиками для использования возможностей генеративного ИИ и внедрение этой технологии в разработку роботов-гуманоидов в Китае, где эти роботы смогут помогать на заводах и заменить ручной труд человека там, где это возможно.

Источник:

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *