Anthropic розкриває показники вразливості до промт-ін’єкцій: відповідь для IT-безпеки

Якщо спробувати впровадити атаку на модель Claude Opus 4.6 у обмеженому середовищі для кодування, вона зазнає повного фіаско — 0% успіху за 200 спроб, навіть без жодних захисних механізмів. Але варто перенести ту саму атаку на графічний інтерфейс з увімкненим…







