Викрадення браузерного агента Anthropic: 31.5% успіхів до активації захисту

Серед провідних лабораторій, що розробляють передові моделі ШІ, найвищі показники впровадження підказок (prompt injection) були опубліковані навесні компанією Anthropic. Якщо спрямувати тестувальника (red-teamer) на новітню модель компанії в браузері, то в 31.5% випадків зловмисникам вдавалося отримати контроль ще до того,…








