随着人们对安全要求的提高,监控摄像头的数量增长越来越快,覆盖的范围也越来越广。由于人工分析海量监控摄像头所捕捉信息的可操作性越来越低,自动化摄像头信息分析成为未来发展的方向。受益于近年来人工智能技术,特别是深度学习技术的发展,单摄像头下的目标检测与跟踪、人脸识别等问题已经得到了较好的解决,如何进一步扩大分析范围,实现多个摄像头之间的联动分析成为新的研究和应用热点。这其中跨摄像头行人再识别问题是亟待解决的一项基本问题。该问题主要研究如何从不同的摄像头中识别出相同的行人。研究的难点在于不同摄像头拍摄的照片存在较强的光线差异,行人的姿势差别很大,摄像头分辨率较低等。
利用深度学习和卷积神经网络模型解决跨摄像头行人再识别问题具有较高的精度,目前已经成为主流方法。以往的工作在解决从视频中提取行人特征时,使用的是固定余量的损失函数。近日,西安交大微电子学院本科生王嘉耘大三期间在人工智能与机器人研究所王进军教授指导下,经过深入研究发现,使用自适应余量选择策略,可以通过动态调节网络模型的学习目标,更适应实时变化学习到的特征空间。进一步研究还发现,使用动态余量的损失函数成功解决了传统的对比损失函数和三相损失函数存在的问题。
该研究成果已发表在计算机视觉领域著名期刊Pattern Recognition(五年影响因子4.991)上,文章题目为:“Deep Ranking Model by Large Adaptive Margin Learning for Person Re-identification”。西安交大微电子学院本科生王嘉耘为该论文的第一作者,西安交通大学为该论文的第一作者单位。
文章链接:http://www.sciencedirect.com/science/article/pii/S0031320317303771
作者:电信学院 田惠莉