提示词防护 (Prompt Protection)

大模型的 Prompt 注入与越狱（Jailbreak）是目前 AI 安全领域最大的威胁之一。该模块旨在检测并拦截恶意请求，防止系统底层提示词（System Prompt）泄露或被操控。

防护策略配置

检测敏感度：支持动态调整为 低、中、高。敏感度越高检测越严格，但也可能伴随一定的误报率增加，建议根据业务场景调试。
系统提示保护：一键开启防止系统提示词被恶意提取的底层防御机制。
敏感关键词与反注入：您可以输入特定的关键词，或配置包含“关键短语”及“正则表达式”的反注入规则。命中这些规则的请求将直接触发防御动作。

拦截动作联动

当检测到恶意注入攻击时，系统支持下发多维度的处置动作：

仅记录：不拦截请求，仅在攻击日志中告警（适合测试观察期）。
人机验证：向发起请求的客户端下发验证码挑战。
直接拦截：立即阻断该 API 请求的执行。