[1]龚震霆,陈光喜,任夏荔,等.基于卷积神经网络和哈希编码的图像检索方法[J].智能系统学报编辑部,2016,11(3):391-400.[doi:10.11992/tis.201603028]
GONG Zhenting,CHEN Guangxi,REN Xiali,et al.An image retrieval method based on a convolutional neural network and hash coding[J].CAAI Transactions on Intelligent Systems,2016,11(3):391-400.[doi:10.11992/tis.201603028]
点击复制
《智能系统学报》编辑部[ISSN 1673-4785/CN 23-1538/TP] 卷:
11
期数:
2016年第3期
页码:
391-400
栏目:
学术论文—机器学习
出版日期:
2016-06-25
- Title:
-
An image retrieval method based on a convolutional neural network and hash coding
- 作者:
-
龚震霆1,2, 陈光喜1,2, 任夏荔1,2, 曹建收1,2
-
1. 桂林电子科技大学 计算机与信息安全学院, 广西 桂林 541004;
2. 广西高校图像图形智能处理重点实验室, 广西 桂林 541004
- Author(s):
-
GONG Zhenting1,2, CHEN Guangxi1,2, REN Xiali1,2, CAO Jianshou1,2
-
1. School of Computer and Information Security, Guilin University of Electronic Technology, Guilin 541004, China;
2. Guangxi Colleges and Universities Key Laboratory of Intelligent Processing of Computer Images and Graphics, Guilin 541004, China
-
- 关键词:
-
图像检索; 人工特征; 卷积神经网络; 卷积特征; 哈希编码
- Keywords:
-
image retrieval; artificial features; convolutional neural network; convolutional features; hash coding
- 分类号:
-
TP391
- DOI:
-
10.11992/tis.201603028
- 摘要:
-
在图像检索中,传统的基于人工特征的检索方法并不能取得很好的效果。为此提出一种结合卷积神经网络和以前最好水准的哈希编码策略的图像检索方法。鉴于近几年卷积神经网络在大量的计算机视觉任务上的巨大进步,该方法首先使用在ILSVRC数据集上预训练过的VGGNet-D网络模型对实验图像数据集提取卷积特征来得到图像的深层表示,再采用以前最好水准的哈希策略将这些深层表示进行编码,从而得到图像的二进制码,最后再进行快速图像检索。在两个常用的数据集Caltech101和Caltech256上的实验结果表明,本文方法的5个策略相比于以前最好水准的相应的图像检索策略在“精度-召回率”和“平均正确率值-编码位数”两个指标上能获得更优异的性能,证明了本文方法在图像检索上的有效性。
- Abstract:
-
For image retrieval, traditional retrieval methods based on artificial features are not effective enough. Hence, we propose an image retrieval method, which combines a convolutional neural network and previous state-of-the-art hash coding strategies. In view of the great progress that convolutional neural networks have made in a large number of computer vision tasks in recent years, this method first uses the model "VGGNet-D" pre-trained on the ILSVRC’s dataset to extract the convolutional features from experimental image datasets to get the deep representations of images, then adopts previous state-of-the-art hash coding strategies to encode the deep representations to obtain the binary codes, and, finally, performs a quick image retrieval. The experimental results on the commonly used Caltech101 and Caltech256 datasets show that this method’s five strategies, compared with the previous state-of-the-art image retrieval strategies, can obtain better, indeed excellent, performance in both the "Precision-Recall" and "mean Average Precision-Number of bits" metrics, proving the effectiveness of the proposed method in image retrieval.
备注/Memo
收稿日期:2016-3-17;改回日期:。
基金项目:国家自然科学基金项目(61462018);广西学位与研究生教育改革和发展专项课题(JGY2014060);广西数字传播与文化软实力中心开放项目(ZFZD1408008);广西高校图像图形智能处理重点实验室开放基金项目(LD15042X).
作者简介:龚震霆,男,1991年生,硕士研究生,主要研究方向为计算机视觉、机器学习。陈光喜,男,1971年生,博士生导师,主要研究方向为可信计算、图像处理。主持完成国家自然基金项目2项、广西省科学基金及企业开发项目多项。获桂林市科技进步三等奖1项、广西教学成果奖一等奖1项。发表学术论文30余篇,主编教材1部。任夏荔,女,1992年生,硕士研究生,主要研究方向为计算机视觉、深度学习。
通讯作者:龚震霆.E-mail:gongxs7@163.com.
更新日期/Last Update:
1900-01-01