梯度混淆归档 - 小码的CheatSheet

构建动态防御体系：基于对抗扰动的ChatGPT API反窃取技术实践

Tim

2025-04-07

在人工智能技术快速发展的背景下，大型语言模型的商业价值催生了新型安全威胁。本文针对API接口场景下的模型窃取攻击，提出一套包含动态响应混淆、对抗样本注入和请求行为分析的立体防护方案，通过系统性工程实践验证防御效果。第一章模型窃取攻击的技术路径分析攻击者通常采用三种技术路线实施模型窃取： ...

AI安全终极战场：揭秘对抗生成网络（GAN）的三重隐匿防御体系

Tim

2025-03-24

tech

.NET, AI安全, GAN防御, 对抗样本, 梯度混淆

在人工智能安全领域，对抗生成网络（GAN）的双向博弈已进入白热化阶段。攻击者利用生成模型的强大表达能力，可制造出以假乱真的深度伪造内容、突破生物特征识别系统，甚至生成针对性对抗样本攻击AI模型。本文提出一套包含动态梯度混淆、对抗样本重编程、隐空间特征净化的三重防御体系，通过技术拆解揭示其防御机理与实