视觉Transformer归档 - 小码的CheatSheet

视觉Transformer注意力可视化：解密深度学习黑箱的革命性突破

Tim

0

60

2025-04-29

.NET, 几何深度学习, 可解释AI, 视觉Transformer

人工智能模型的可解释性问题始终是制约技术落地的关键瓶颈。在计算机视觉领域，视觉Transformer（Vision Transformer,...

突破标注依赖:解密SAM模型零样本图像分割的三大核心技术

Tim

0

66

2025-04-10

SAM模型, 三维计算机视觉, 元学习, 几何深度学习, 图像分割, 视觉Transformer, 零样本学习

在计算机视觉领域，图像分割长期受制于特定任务的标注数据需求，这一瓶颈直到Segment Anything Model(SAM)的横空出世才被彻底打破。本文将从模型架构、训练策略、泛化机制三个维度，深入剖析这个改变游戏规则的突破性技术。一、SAM模型的技术架构解析1.1...

颠覆性突破：视觉Transformer与激光雷达融合重构自动驾驶感知边界

Tim

0

79

2025-03-22

.NET, AI测试工具, 元学习, 光雷达融合, 自动驾驶感知, 视觉Transformer

在自动驾驶技术演进过程中，感知系统始终是决定安全性与可靠性的核心战场。传统多传感器融合方案受限于特征表达方式与信息交互机制，难以突破复杂场景下的性能天花板。本文提出基于时空联合建模的跨模态融合架构，通过设计"三维注意力蒸馏网络"与"动态特征补偿机制"，在KITTI数据集上实现目标检测mAP值提升12