系统仿真学报 ›› 2018, Vol. 30 ›› Issue (7): 2794-2800.doi: 10.16182/j.issn1004731x.joss.201807045

• 短文 • 上一篇    下一篇

基于图像描述的人物检索方法

李亚栋, 莫红, 王世豪, 周忠, 吴威   

  1. 北京航空航天大学虚拟现实技术与系统国家重点实验室,北京 100191
  • 收稿日期:2017-08-01 出版日期:2018-07-10 发布日期:2019-01-08
  • 作者简介:李亚栋(1992-),男,山西吕梁,硕士,研究方向为图像描述和计算机视觉;莫红(1988-),女,湖北襄阳,博士,研究方向为机器视觉。
  • 基金资助:
    国家自然科学基金(61572061, 61472020),国家“863”高技术研究发展计划(2015AA016403)

Person Retrieval Method Based on Image Caption

Li Yadong, Mo Hong, Wang Shihao, Zhou Zhong, Wu Wei   

  1. State Key Laboratory of Virtual Reality Technology and Systems, Beihang University, Beijing 100191, China
  • Received:2017-08-01 Online:2018-07-10 Published:2019-01-08

摘要: 监控场景中特定人物的检索是安防领域重要且迫切的需求。近年来,图像检索领域的方法主要基于图像内容的方法,但是由于该类方法需要待检索图像作为输入,无法满足监控安防的实际需求。提出一种基于图像描述的人物检索方法,并提供一个标注了人物描述的监控数据集SPCD。在此数据集上验证该方法,性别预测准确率达到86.5%,服饰颜色的匹配准确率达到93.5%,行为分类的准确率达到65.5%,为监控场景中的人物检索提供了一种新的有效方式。

关键词: 监控场景, 图像检索, 图像描述, 多属性标签

Abstract: Retrieve specific person in the surveillance scene is an important and urgent demand on the security field. In recent years, the method of image retrieval is mainly based on image content, which requires the image to be retrieved works as input and thus can’t meet the actual needs of surveillance and security. We propose a method of person retrieval based on image caption and present a new surveillance dataset SPCD which tags person caption. We verify the method in new dataset, the accuracy of gender, dress color and action respectively reaches 86.5%, 93.5% and 65.5%. This paper provides an effective way for application of retrieval person in the surveillance scene.

Key words: surveillance scene, image retrieval, image caption, multi-attribute labels

中图分类号: