Appearance
提示词防护 (Prompt Protection)
大模型的 Prompt 注入与越狱(Jailbreak)是目前 AI 安全领域最大的威胁之一。该模块旨在检测并拦截恶意请求,防止系统底层提示词(System Prompt)泄露或被操控。
防护策略配置
- 检测敏感度:支持动态调整为
低、中、高。敏感度越高检测越严格,但也可能伴随一定的误报率增加,建议根据业务场景调试。 - 系统提示保护:一键开启防止系统提示词被恶意提取的底层防御机制。
- 敏感关键词与反注入:您可以输入特定的关键词,或配置包含“关键短语”及“正则表达式”的反注入规则。命中这些规则的请求将直接触发防御动作。
拦截动作联动
当检测到恶意注入攻击时,系统支持下发多维度的处置动作:
- 仅记录:不拦截请求,仅在攻击日志中告警(适合测试观察期)。
- 人机验证:向发起请求的客户端下发验证码挑战。
- 直接拦截:立即阻断该 API 请求的执行。
