模型窃取防御归档 - 小码的CheatSheet

构建动态防御体系：基于对抗扰动的ChatGPT API反窃取技术实践

Tim

0

46

2025-04-07

.NET, API安全, 为分析, 对抗样本, 梯度混淆, 模型窃取防御

在人工智能技术快速发展的背景下，大型语言模型的商业价值催生了新型安全威胁。本文针对API接口场景下的模型窃取攻击，提出一套包含动态响应混淆、对抗样本注入和请求行为分析的立体防护方案，通过系统性工程实践验证防御效果。第一章模型窃取攻击的技术路径分析攻击者通常采用三种技术路线实施模型窃取： ...

Falcon-40B模型水印技术防御黑盒攻击的鲁棒性测试与工程实践

Tim

0

71

2025-03-31

.NET, AI安全, AI艺术, Falcon-40B, 模型窃取防御

随着大模型商业化进程加速，模型窃取攻击已成为AI安全领域最严峻的挑战之一。攻击者通过黑盒API逆向工程、参数蒸馏等方式，可在不接触原始模型参数的情况下重构出功能近似的替代模型。本文以Falcon-40B模型为研究对象，针对其水印防御系统展开多维度的鲁棒性测试，揭示现有防御技术的有效边界与改进方向。