AI安全架构归档 - 小码的CheatSheet

生成式AI安全攻防战：从Prompt注入到模型投毒的深度防御体系

Tim

0

176

2025-04-20

.NET, 1.5测评, AI安全架构, Prompt注入防御, 模型投毒防护

随着生成式AI技术在各领域的广泛应用，其面临的安全威胁已从理论风险演变为实际攻击。本文针对两类核心攻击手段——Prompt注入攻击与模型投毒攻击，构建了一套覆盖全生命周期的防御体系，并给出可落地的技术实施方案。一、Prompt注入攻击的技术本质与防御架构 1. 攻击机理深度解析 ...

大模型安全防护实战：从提示注入防御到输出过滤的完整技术架构

Tim

0

71

2025-04-19

.NET, AI安全架构, 大模型安全对齐, 提示注入防御, 模型防护, 输出内容过滤

在人工智能技术快速发展的今天，大型语言模型的安全防护已成为行业焦点。根据最新研究数据显示，未受保护的大模型遭受提示注入攻击的成功率高达63%，而有害内容生成概率超过28%。本文将从攻击原理剖析入手，深入探讨构建多层防御体系的技术方案。一、提示注入攻击深度解析 1.1 攻击类型图谱 ...