OpenAI повысит безопасность своих ИИ-моделей с помощью «иерархии инструкций»

OpenAI разработала новый метод под названием «Иерархия инструкций» для повышения безопасности своих больших языковых моделей (LLM). Этот метод, впервые применённый в новой модели GPT-4o Mini, направлен на предотвращение нежелательного поведения ИИ, вызванного манипуляциями недобросовестных пользователей с помощью определённых команд.

Источник изображения: Copilot

Руководитель платформы API в OpenAI Оливье Годеман (Olivier Godement) объяснил, что «иерархия инструкций» позволит предотвращать опасные инъекции промтов с помощью скрытых подсказок, которые пользователи используют для обхода ограничений и изначальных установок модели, и блокировать атаки типа «игнорировать все предыдущие инструкции».

Новый метод, как пишет The Verge, отдаёт приоритет исходным инструкциям разработчика, делая модель менее восприимчивой к попыткам конечных пользователей заставить её выполнять нежелательные действия. В случае конфликта между системными инструкциями и командами пользователя, модель будет отдавать наивысший приоритет именно системным инструкциям, отказываясь выполнять инъекции.

Исследователи OpenAI считают, что в будущем будут разработаны и другие, более сложные средства защиты, особенно для агентных сценариев использования, при которых ИИ-агенты создаются разработчиками для собственных приложений. Учитывая, что OpenAI сталкивается с постоянными проблемами в области безопасности, новый метод, применённый к GPT-4o Mini, имеет большое значение для последующего подхода к разработке ИИ-моделей.

Источник:

Ответить

OpenAI повысит безопасность своих ИИ-моделей с помощью «иерархии инструкций»

ОтветитьОтменить ответ

10 причин не покупать продукцию Apple

«Сбер» начал устанавливать свои приложения на iPhone в отделениях банка

Скачать Steam для Windows

Отравленные документы. Как использовать самые опасные баги в Microsoft Office за последнее время

Большой проброс. Оттачиваем искусство pivoting на виртуалках с Hack The Box

IFA 2025: Ulefone анонсувала бренд RugOne та лінійку захищених телефонів Xever 7 зі знімними акумуляторами

Компанія Microsoft заборонила росіянам встановлення Windows 11 і 10 з офіційного сайту

Microsoft повернула росіянам можливість завантажувати та встановлювати Windows

У Великій Британії схвалили поглинання Activision Blizzard корпорацією Microsoft

Припинення підтримки Windows 10 назвали катастрофою: що чекає на мільйони комп'ютерів

IFA 2025: Ulefone анонсувала бренд RugOne та лінійку захищених телефонів Xever 7 зі знімними акумуляторами

Компанія Microsoft заборонила росіянам встановлення Windows 11 і 10 з офіційного сайту

Microsoft повернула росіянам можливість завантажувати та встановлювати Windows

Читайте также:

ОтветитьОтменить ответ