打破视角壁垒:创艺学院智造系统工程中心武颖娜课题组提出基于单应性对齐的异常检测创新框架VSAD

ON2026-02-04CATEGORY科研进展

当前高端制造业全流程质检中,人工智能的落地应用面临场景复杂多变、异常种类繁多且数据稀少、单视角易误检漏检、以及功能异常识别困难等多重挑战。针对这些行业共性难题,上海科技大学创意与艺术学院智造系统工程中心(CASE)武颖娜课题组致力于研发覆盖制造全流程的异常识别算法与智能质检系统。

近日课题组联合密歇根大学安娜堡分校研究团队在多视角异常检测领域取得新突破。多视角成像技术是检测复杂几何结构产品表面缺陷的主流方案,但现有方法常因缺乏跨视角的几何一致性约束,导致不同视角下采集到的信息不完整。这种碎片化的单视角建模方法难以准确定位缺陷。为攻克这一技术难题,研究人员提出了名为VSAD(View Sense Anomaly Detection)的创新性框架。该框架通过单应性变换建立多视角图像之间的几何关系,有效避免了不同视角下的信息缺失,大幅提升模型对缺陷的识别定位能力与鲁棒性。实验表明,VSAD在像素级、视角级与样本级指标上均优于现有技术,尤其在复杂纹理与强视角变化条件下,展现出更高的检测稳定性与精度。

 

1. VSAD模型架构图

 

相关研究成果以“Unsupervised Multi-View Visual Anomaly Detection via Progressive Homography-Guided Alignment”为题被第40届AAAI人工智能国际会议接收。上海科技大学2024级硕士研究生陈鑫涛为第一作者,2023级硕士研究生郑博中与刘云为共同作者,论文由武颖娜研究员指导完成。上海科技大学为第一完成单位。

VSAD框架的提出基于课题组前期的系统性研究。此前,课题组首次构建了面向工业应用场景的多模态异常检测数据集Phys-AD以及基于交互的视频异常检测数据集MulSen-AD,更进一步提出了一系列创新方法,包括物理先验知识驱动的异常检测新范式、可拓展的三维异常生成及检测网络、决策级多传感器融合算法、基于连续几何表示的三维异常定位算法等。相关成果已在CVPR、ICCV等重要国际会议上发表。

 

2. 2024级硕士研究生陈鑫涛

 

Arxiv链接:https://arxiv.org/abs/2511.18766