Skip to content

提示词防护 (Prompt Protection)

大模型的 Prompt 注入与越狱(Jailbreak)是目前 AI 安全领域最大的威胁之一。该模块旨在检测并拦截恶意请求,防止系统底层提示词(System Prompt)泄露或被操控。

防护策略配置

  • 检测敏感度:支持动态调整为 。敏感度越高检测越严格,但也可能伴随一定的误报率增加,建议根据业务场景调试。
  • 系统提示保护:一键开启防止系统提示词被恶意提取的底层防御机制。
  • 敏感关键词与反注入:您可以输入特定的关键词,或配置包含“关键短语”及“正则表达式”的反注入规则。命中这些规则的请求将直接触发防御动作。

拦截动作联动

当检测到恶意注入攻击时,系统支持下发多维度的处置动作:

  1. 仅记录:不拦截请求,仅在攻击日志中告警(适合测试观察期)。
  2. 人机验证:向发起请求的客户端下发验证码挑战。
  3. 直接拦截:立即阻断该 API 请求的执行。

专注边缘加速,更懂业务安全