[1]郑卓然,魏绎汶,贾修一.基于全局与局部感知网络的超高清图像去雾方法[J].智能系统学报,2024,19(1):89-96.[doi:10.11992/tis.202304013]
ZHENG Zhuoran,WEI Yiwen,JIA Xiuyi.UHD image dehazing method based on global and local aware networks[J].CAAI Transactions on Intelligent Systems,2024,19(1):89-96.[doi:10.11992/tis.202304013]
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
19
期数:
2024年第1期
页码:
89-96
栏目:
学术论文—机器感知与模式识别
出版日期:
2024-01-05
- Title:
-
UHD image dehazing method based on global and local aware networks
- 作者:
-
郑卓然, 魏绎汶, 贾修一
-
南京理工大学 计算机科学与工程学院, 江苏 南京 210094
- Author(s):
-
ZHENG Zhuoran, WEI Yiwen, JIA Xiuyi
-
School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China
-
- 关键词:
-
图像去雾; 超高清图像; 多层感知机; 空间拓扑信息; 局部特征提取; 全局特征提取; 深度学习; 实时去雾
- Keywords:
-
image dehazing; UHD image; multilayer perceptron; spatial topology information; local feature extraction; global feature extraction; deep learning; real-time image dehazing
- 分类号:
-
TP181
- DOI:
-
10.11992/tis.202304013
- 文献标志码:
-
2023-08-01
- 摘要:
-
当前,为实现图像全局建模的目的,基于多层感知机(multi-layer perceptron,MLP)的模型通常需要将图像上的像素进行平铺,之后实施一个自注意力机制或“混合”增强方案以获得图像的长范围依赖。然而,这些方法通常消耗大量的计算资源来弥补图像重建丢失的空间拓扑信息。特别是对于超高清图像去雾任务,大量堆积MLP的模型在资源受限的设备上执行一张超高清带雾图像时会出现内存溢出的问题。为了解决这个问题,本文提出了一种可以在单个GPU上对分辨率为4 k的图像进行实时去雾(110 f/s)的模型,该模型的建模过程中保持了图像空间结构信息,同时具有低计算复杂度的优点。
- Abstract:
-
Current multilayer perceptron (MLP)-based models usually require flattening pixels on an image and subsequently enforce a self-attention mechanism or “Mix” enhancement scheme to achieve global modeling of images and obtain long-range dependence of the image. However, these approaches generally consume considerable computing resources to bridge the loss of spatial topological information in image reconstruction. Particularly for UHD image dehazing tasks, numerous stacked MLP models suffer from memory overflow when running a UHD-hazed image on a resource-constrained device. A novel model for real-time dehazing of 4 K images on a single GPU (110 fps) is proposed here to address this issue. This model is advantageous because it maintains spatial information of the raw image and has low computational complexity.
备注/Memo
收稿日期:2023-04-07。
基金项目:国家自然科学基金项目(62176123).
作者简介:郑卓然,博士研究生,主要研究方向为深度学习和图像增强。E-mail:zhengzr@njust.edu.cn;魏绎汶,硕士研究生,主要研究方向为图像增强。E-mail:weiyw@njust.edu.cn;贾修一,教授,博士生导师,CCF高级会员,主要研究方向为机器学习、粒计算和数据挖掘。主持国家自然科学基金项目3项,参与重点研发计划项目、国家自然科学基金企业联合基金重点项目等多项。发表学术论文100余篇。E-mail:jiaxy@njust.edu.cn
通讯作者:贾修一. E-mail:jiaxy@njust.edu.cn
更新日期/Last Update:
1900-01-01