[1]徐伟峰,雷耀,王洪涛,等.面向边缘设备的目标检测模型研究[J].智能系统学报,2025,20(4):871-881.[doi:10.11992/tis.202406015]
XU Weifeng,LEI Yao,WANG Hongtao,et al.Research on object detection models for edge devices[J].CAAI Transactions on Intelligent Systems,2025,20(4):871-881.[doi:10.11992/tis.202406015]
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
20
期数:
2025年第4期
页码:
871-881
栏目:
学术论文—机器学习
出版日期:
2025-08-05
- Title:
-
Research on object detection models for edge devices
- 作者:
-
徐伟峰1,2, 雷耀1, 王洪涛1,2, 张旭1
-
1. 华北电力大学(保定) 计算机系, 河北 保定 071003;
2. 河北省能源电力知识计算重点实验室, 河北 保定 071003
- Author(s):
-
XU Weifeng1,2, LEI Yao1, WANG Hongtao1,2, ZHANG Xu1
-
1. Department of Computer, North China Electric Power University(Baoding), Baoding 071003, China;
2. Hebei Key Laboratory of Knowledge Computing for Energy & Power, Baoding 071003, China
-
- 关键词:
-
目标检测; YOLO; 边缘设备; 推理精度; 推理速度; 数据读写量; 计算复杂度; 模型部署
- Keywords:
-
object detection; YOLO; edge devices; inference accuracy; inference speed; data read/write volume; computational load; model deployment
- 分类号:
-
TP391.4
- DOI:
-
10.11992/tis.202406015
- 文献标志码:
-
2024-12-12
- 摘要:
-
现有目标检测模型在边缘设备上部署时,其检测性能和推理速度的平衡有较大提升空间。针对此问题,本文基于YOLO (you can only look once) v8提出一种可部署到多类边缘设备上的目标检测模型。在模型的骨干网络部分,设计了EC2f (extended coarse-to-fine) 结构,在降低参数量和计算复杂度的同时降低数据读写量;在颈部网络部分,将颈部网络替换为YOLOv6-3.0版本的颈部网络,加速了模型推理,并将推理精度维持在较好水平;预测头网络部分设计了多尺度卷积检测头,进一步降低了模型的计算复杂度和参数度。设计了两个版本 (n/s尺度)以适应不同的边缘设备。在X光数据集的实验表明,模型在推理精度上比同尺度的基准模型分别提升0.5/1.7百分点,推理速度上分别提升11.6%/11.2%。在其他数据集上的泛化性能测试表明,模型的推理速度提升了10%以上,精度降低控制在1.3%以内。实验证明,模型在推理精度和速度之间实现了良好的平衡。
- Abstract:
-
Existing object detection models can be improved in terms of balancing detection performance and inference speed on edge devices. Hence, a YOLO (you can only look once) v8-based model optimized for various edge devices is proposed. In the Backbone, an EC2f (extended coarse-to-fine) structure is designed to reduce parameters, computation, and data read/write volume. In the Neck, the YOLOv6-3.0 version is used to accelerate inference while maintaining accuracy. In the Head, a multiscale convolutional detection head, which further reduces computational load and complexity, is featured. Two versions (n/s scales) are designed to suit different edge devices. Experiments on an X-ray dataset demonstrate that the proposed model improves inference accuracy by 0.5%/1.7% and speed by 11.6%/11.2% compared with baseline models of the same scale. Generalization tests on other datasets present an increase in inference speed of over 10% and an accuracy reduction controlled within 1.3%. Overall, the model achieves a satisfactory balance between inference accuracy and speed.
备注/Memo
收稿日期:2024-6-11。
基金项目:国家自然科学基金项目(61802124);中央高校基本科研业务费专项(2023MS137);中国高校产学研创新基金项目(2023DT6).
作者简介:徐伟峰,讲师,博士,主要研究方向为图像识别技术、形式化验证方法和低空空管系统,承担科研项目10项。E-mail:weifengxu@163.com。;雷耀,硕士研究生,主要研究方向为深度学习和目标检测,发表学术论文1篇。E-mail:2260140046@qq.com。;王洪涛,副教授,博士,中国计算机学会会员,主要研究方向为人工智能安全、自然语言处理、隐私计算和知识计算。主持国家自然科学基金项目1项、中央高校基本科研业务费专项2项。发表学术论文28篇。E-mail:wanght@ncepu.edu.cn。
通讯作者:王洪涛. E-mail:wanght@ncepu.edu.cn
更新日期/Last Update:
1900-01-01