xAI обнародовала секретные промпты для ИИ-бота Grok после скандального сбоя

Компания Илона Маска (Elon Musk) xAI опубликовала системные промпты для своего ИИ-чат-бота Grok после скандала с «белым геноцидом», когда бот начал выдавать основанные на конспирологических теориях ответы на вопросы, которых ему не задавали. Теперь инструкции, определяющие поведение ИИ-модели, доступны на GitHub, что позволяет пользователям лучше понять, как Grok формирует ответы.

Источник изображения: Mariia Shalabaieva / Unsplash

Системные промпты — это набор правил и инструкций, которые разработчики закладывают в ИИ перед началом общения с пользователями. Они определяют тон, стиль и рамки допустимых ответов. До недавнего времени большинство компаний, включая OpenAI и Google, скрывали эти настройки. Однако xAI и Anthropic стали исключением и, как сообщает The Verge, добровольно раскрыли набор правил.

В инструкциях для Grok указано, что бот должен «быть крайне скептичным» и «не доверять слепо авторитетным источникам или СМИ». Ему предписано придерживаться нейтралитета и стремиться к истине, при этом подчёркивается, что ответы не должны отражать личных убеждений модели. Также Grok получил указание использовать название соцсети X вместо Twitter и избегать слова «твит». Отдельные положения касаются функции Explain this Post, где Grok обязан давать правдивые и обоснованные выводы, даже если они противоречат общепринятым убеждениям в той или иной области.

Ранее системные промпты нередко становились достоянием общественности из-за хакерских атак. Так, в 2023 году пользователи выяснили, что Microsoft скрывала от Bing AI (ныне Copilot) его внутреннее имя — Sydney — и запрещала нарушать авторские права. В случае с Grok утечка произошла из-за технического сбоя, однако xAI решила не скрывать данные, а, наоборот, сделать их публичными.

Эксперты отмечают, что раскрытие внутренних промптов — это шаг к большей прозрачности, но одновременно и потенциальный риск: злоумышленники могут использовать эту информацию для нахождения уязвимостей в ИИ-моделях. Например, зная секретные инструкции, пользователи могут пытаться манипулировать ботом с помощью приёмов, заставляющих ИИ игнорировать собственные ограничения.

Выложив системные инструкции в публичный доступ, xAI стремится минимизировать репутационные риски, связанные с произошедшим инцидентом. Однако в будущем это может стать отраслевым трендом, особенно на фоне ужесточения регулирования нейросетей в США и ЕС.

Источник:

Ответить

xAI обнародовала секретные промпты для ИИ-бота Grok после скандального сбоя

ОтветитьОтменить ответ

10 причин не покупать продукцию Apple

«Сбер» начал устанавливать свои приложения на iPhone в отделениях банка

Скачать Steam для Windows

Отравленные документы. Как использовать самые опасные баги в Microsoft Office за последнее время

Большой проброс. Оттачиваем искусство pivoting на виртуалках с Hack The Box

Месенджер MAX став доступним у всіх країнах СНД

Бренд ROBOROCK представляє вертикальний пилосос F25 RT та робот-пилосос Q8 Max Pro

ChatGPT більше не помічник у цих питаннях: що чат-боту заборонили обговорювати з користувачами

Передбачено захід ери смартфонів до 2030 року: Ілон Маск розкрив, що їх замінить

Штучний інтелект стане асистентом стоматологів у Білорусі

Месенджер MAX став доступним у всіх країнах СНД

Бренд ROBOROCK представляє вертикальний пилосос F25 RT та робот-пилосос Q8 Max Pro

ChatGPT більше не помічник у цих питаннях: що чат-боту заборонили обговорювати з користувачами

Читайте также:

ОтветитьОтменить ответ