OpenAI повысит безопасность своих ИИ-моделей с помощью «иерархии инструкций»

OpenAI разработала новый метод под названием «Иерархия инструкций» для повышения безопасности своих больших языковых моделей (LLM). Этот метод, впервые применённый в новой модели GPT-4o Mini, направлен на предотвращение нежелательного поведения ИИ, вызванного манипуляциями недобросовестных пользователей с помощью определённых команд.

Источник изображения: Copilot

Руководитель платформы API в OpenAI Оливье Годеман (Olivier Godement) объяснил, что «иерархия инструкций» позволит предотвращать опасные инъекции промтов с помощью скрытых подсказок, которые пользователи используют для обхода ограничений и изначальных установок модели, и блокировать атаки типа «игнорировать все предыдущие инструкции».

Новый метод, как пишет The Verge, отдаёт приоритет исходным инструкциям разработчика, делая модель менее восприимчивой к попыткам конечных пользователей заставить её выполнять нежелательные действия. В случае конфликта между системными инструкциями и командами пользователя, модель будет отдавать наивысший приоритет именно системным инструкциям, отказываясь выполнять инъекции.

Исследователи OpenAI считают, что в будущем будут разработаны и другие, более сложные средства защиты, особенно для агентных сценариев использования, при которых ИИ-агенты создаются разработчиками для собственных приложений. Учитывая, что OpenAI сталкивается с постоянными проблемами в области безопасности, новый метод, применённый к GPT-4o Mini, имеет большое значение для последующего подхода к разработке ИИ-моделей.

Источник:

Ответить

OpenAI повысит безопасность своих ИИ-моделей с помощью «иерархии инструкций»

ОтветитьОтменить ответ

10 причин не покупать продукцию Apple

«Сбер» начал устанавливать свои приложения на iPhone в отделениях банка

Скачать Steam для Windows

Отравленные документы. Как использовать самые опасные баги в Microsoft Office за последнее время

Большой проброс. Оттачиваем искусство pivoting на виртуалках с Hack The Box

Флагманський захищений планшет OSCAL SPIDER 10 надійшов у продаж з ліхтарем яскравістю 1100 люмен та акумулятором 20 000 мАг

У російському месенджері Max зареєструвалися понад 40 мільйонів користувачів

Зовнішні акумулятори Aukey PB-Y47 та Aukey PB-Y53P ємністю 10 000 мАг зарядять ваші смартфони максимально швидко

Ринок сказав Windows 11 «ні». Повернулася ОС Windows 7

Смартфони серії Ulefone Armor 29 з двома екранами AMOLED приносять підвищену зручність та розширену багатозадачність

Флагманський захищений планшет OSCAL SPIDER 10 надійшов у продаж з ліхтарем яскравістю 1100 люмен та акумулятором 20 000 мАг

У російському месенджері Max зареєструвалися понад 40 мільйонів користувачів

Зовнішні акумулятори Aukey PB-Y47 та Aukey PB-Y53P ємністю 10 000 мАг зарядять ваші смартфони максимально швидко

Читайте также:

ОтветитьОтменить ответ