Appearance
智能语义缓存
传统的 CDN 缓存依赖 URL 的绝对匹配,对动态的大模型对话接口毫无作用。2WL Edge Scdn引入了基于向量分析的“语义缓存”技术。它可以缓存相似的 AI 请求响应,大幅提升回复速度,并直接为您节省高昂的 API 调用成本。
核心参数配置
- 相似度阈值:通过滑动条(0~1,默认
0.85)控制匹配的严格程度。阈值越高,需要用户提问的语义越接近才会命中缓存;阈值越低则命中率越高。 - 缓存生命周期:支持配置
缓存时长(默认 600 秒)、占用内存的缓存大小(默认 100MB)以及存储的最大条目(默认 1000 条)。
IP 区分缓存隔离
系统提供 IP区分缓存 选项:
- 关闭状态(默认):所有 IP 共享同一份语义缓存,最大化命中率与成本节省。
- 开启状态:以客户端 IP 为维度隔离缓存,确保 A 用户不会获取到基于 B 用户提问生成的相似缓存响应,适用于隐私要求极高的场景。
⚠️ 前置依赖提醒
在配置本功能之前,请确保您已经在 AI 防护基础配置 中正确添加了需要受保护的大模型 API 路径,否则本策略将不会生效。
