智能系统学报 /oa 人工智能诺奖热中的反思与展望 /oa/darticle.aspx?type=view&id=202410034 2024年09月05 00:00 2024年5期 1071 1071 226093 陈小平 视觉深度学习模型压缩加速综述 /oa/darticle.aspx?type=view&id=202311011 近年来,深度学习模型规模越来越大,在嵌入式设备等资源受限环境中,大规模视觉深度学习模型难以实现高效推理部署。模型压缩加速可以有效解决该挑战。尽管已经出现相关工作的综述,但相关工作集中在卷积神经网络的压缩加速,缺乏对视觉Transformer模型压缩加速方法的整理和对比分析。因此,本文以视觉深度学习模型压缩技术为核心,对卷积神经网络和视觉Transformer模型2个最重要的视觉深度模型进行了相关技术手段的整理,并对技术热点和挑战进行了总结和分析。本文旨在为研究者提供一个全面了解模型压缩和加速领域的视角,促进深度学习模型压缩加速技术的发展。 2024年09月05 00:00 2024年5期 1072 1081 3773750 丁贵广<sup>1,2</sup>, 陈辉<sup>2</sup>, 王澳<sup>1,2,3</sup>, 杨帆<sup>1,2,3</sup>, 熊翊哲<sup>1,2,3</sup>, 梁伊雯<sup>1,2,3</sup> 乳腺钼靶肿块自监督预训练迁移检测方法研究 /oa/darticle.aspx?type=view&id=202304032 借助深度学习技术在乳腺钼靶领域辅助医生进行乳腺癌诊断在当下已经成为很多研究关注的热点,诊断技术主要包括良恶性分类、病灶区域检测以及病灶区域分割等。由于深度学习训练的模型性能很大程度上依赖于大量的带有标注的数据,而医学图像数据集往往存在数据量少、标注成本昂贵以及公开数据集标注质量差等现象,所以在医学图像领域应用深度学习技术具有重重困难。为使基于深度学习的乳腺钼靶计算机辅助诊断技术的开发不受限于大量有标注的数据,提出一种适用于钼靶自监督目标检测方法来完成乳腺钼靶肿块检测任务,利用大量来自肿瘤医院的数据预训练,并在公开数据集DDSM上进行微调与测试。实验结果表明,提出模型在乳腺钼靶肿块检测任务中表现优异,并且不依赖于位置标签,具有重要的研究价值与应用前景。 2024年09月05 00:00 2024年5期 1082 1091 5184997 莫宏伟<sup>1</sup>, 孙琪<sup>1</sup>, 孙鹏<sup>1</sup>, 张显玉<sup>2</sup>, 孙江宏<sup>3</sup>, 孙惟嘉<sup>3</sup> 融合边界注意力的特征挖掘息肉小目标网络 /oa/darticle.aspx?type=view&id=202306025 从结肠图像中分割息肉小目标病变区域对于预防结直肠癌至关重要,它可以为结直肠癌的诊断提供有价值的信息。然而目前现有的方法存在2个局限性:一是不能稳健捕获全局上下文信息,二是未能充分挖掘细粒度细节特征信息。因此,提出融合边界注意力的特征挖掘息肉小目标网络(transformer feature boundary network,TFB-Net)。该网络主要包括3个核心模块:首先,采用Transformer辅助编码器建立长程依赖关系,补充全局信息;其次,设计特征挖掘模块进一步细化特征,学习到更好的特征;最后,使用边界反转注意力模块加强对边界语义空间的关注,提高区域辨别能力。在5个息肉小目标数据集上进行广泛实验,实验结果表明TFB-Net具有优越的分割性能。 2024年09月05 00:00 2024年5期 1092 1101 5477529 刘国奇<sup>1,2</sup>, 陈宗玉<sup>1,2</sup>, 刘栋<sup>1,2</sup>, 常宝方<sup>1</sup>, 王佳佳<sup>1,2</sup> 基于粗到细的多尺度单幅图像去雾方法 /oa/darticle.aspx?type=view&id=202305005 为了解决现有图像去雾算法易出现细节纹理丢失、颜色失真或对非均匀浓雾处理不彻底的问题,提出一种基于粗到细的多尺度单幅图像去雾方法。首先,主干网络使用残差特征注意力模块对有雾图像进行特征提取;其次,将不同尺度的输入图像进行卷积预处理,通过多尺度特征融合模块将预处理的浅层特征与主干网络融合;再次,将不同粒度的非对称特征进行有效融合;最后,将浅层信息与深层信息自适应混合输出,通过对比正则损失构建正负样本信息,使得去雾图像更接近无雾图像。实验结果表明,与已有代表性的去雾方法相比,提出的方法能对合成数据集与真实数据集进行有效去雾,在细节保留与色彩还原上优于对比方法。 2024年09月05 00:00 2024年5期 1102 1110 4844263 王德文<sup>1,2</sup>, 陈威<sup>1</sup>, 苏攀<sup>1,2</sup> 结合Segformer与增强特征金字塔的文本检测方法 /oa/darticle.aspx?type=view&id=202301013 针对自然场景文本检测算法中的小尺度文本漏检、类文本像素误检以及边缘定位不准确的问题,提出一种基于Segformer和增强特征金字塔的文本检测模型。该模型首先采用基于混合Transformer (mix Transformer, MiT)的编码器生成多尺度特征图;然后,在具有特征金字塔结构解码器的上采样部分,提出级联融合注意力模块,通过全局平均池化、全局最大池化和Ghost模块获取全局通道信息并保留文本特征;接着,在解码器的特征融合部分提出两级正交融合注意力模块,利用非对称卷积分别从水平和垂直方向进行信息增强;最后,利用可微分二值化对结果进行后处理。将本文方法在ICDAR2015、ShopSign1265和MTWI 3个数据集上进行实验,相比于其他8种方法,本文方法的F值均为最优,分别达到了87.8%、59.1%和74.8%。结果表明,本文方法有效提高了文本检测的准确率。 2024年09月05 00:00 2024年5期 1111 1125 9965272 张铭泉<sup>1,2</sup>, 张泽恩<sup>1,2</sup>, 曹锦纲<sup>1,2</sup>, 邵绪强<sup>1,2</sup> 基于改进Transformer和超图模型的股票趋势预测方法研究 /oa/darticle.aspx?type=view&id=202308017 股票预测是一项令人痴迷又极具挑战的任务。近年来,融合关系信息的股票时序预测方法取得一些进展,但仍存在如下问题:首先,基于图神经网络的方法仅考虑股票之间简单的成对关系,而未考虑股票间的高阶协同关系。其次,现有方法采用预定义图的方式直接给出股票间的静态关系,无法建模股票间潜在的动态变化关系。为了解决上述问题,提出一种端到端的动态超图卷积神经网络股票趋势预测框架。该框架基于改进的Transformer提取股票的时序信息,通过静态超图和动态超图将股票间的协同关系信息引入到时序建模中。在中国A股和美股市场数据集上的实验结果表明,与当前先进模型相比,本文模型的预测性能具有显著优势。 2024年09月05 00:00 2024年5期 1126 1135 5164385 郝剑龙, 刘志斌, 张宸, 孙琪炜, 常新功 基于模态信息度评估策略的掌纹掌静脉特征识别方法 /oa/darticle.aspx?type=view&id=202310002 多模态生物特征识别技术凭借其出色的识别效果和稳健的可靠性引起了业界的广泛关注。然而,传统多模态生物特征识别方法通常直接在特征层或决策层进行融合,很少考虑模态样本质量不同导致的融合效果差异。此外,由于缺乏大规模公开多模态生物特征数据库,多模态生物特征识别方法的研究受到一定程度上的限制。因此,设计了一款手部多模态数据采集设备,并自建了手部多模态数据库,用于多模态生物特征识别方法的验证与评估;提出了一种基于模态信息度评估策略的掌纹掌静脉特征识别方法,利用样本标签对应的类别置信度来评估每个模态特征的信息度,从而使模型在融合过程中根据不同模态对身份识别的贡献率进行自适应的权重分配。实验表明该方法在2个公开的数据库以及自建数据库上均取得了最高识别率。 2024年09月05 00:00 2024年5期 1136 1148 6678374 潘在宇<sup>1</sup>, 徐家梦<sup>1</sup>, 王军<sup>1</sup>, 贾伟<sup>2</sup> 基于深度学习的K近邻图迭代静脉识别算法研究 /oa/darticle.aspx?type=view&id=202307009 深度学习在计算机视觉中具有强大的特征表达能力,近年来广泛应用于静脉特征的提取与识别。通常,基于深度学习的静脉识别模型在训练阶段,每次仅输入1幅图像及其对应的标签,学习图像与标签之间的映射关系,然而,这种每次只处理单幅图像的方法,难以捕捉不同类别多幅静脉图像之间的关系。为了解决该问题,提出一种基于深度学习的K近邻图迭代静脉识别算法。用较优的深度学习模型提取掌静脉图像特征;利用K近邻算法通过特征距离在训练集中选出最近的K幅图像及其标签,通过这些特征向量生成标签传播矩阵和标签矩阵;利用图迭代算法预测待分类图像的标签,完成分类。在香港理工大学和同济大学提供的掌静脉数据集上进行实验,最高识别精度分别为99.67%和92.72%。 2024年09月05 00:00 2024年5期 1149 1156 4176202 王闪闪<sup>1</sup>, 巩长庆<sup>1</sup>, 秦华锋<sup>1</sup>, 王军<sup>2</sup>, 李艳涛<sup>3</sup>, 杨数强<sup>4</sup> 多尺度知识引导局部增强的小样本细粒度图像分类方法 /oa/darticle.aspx?type=view&id=202309003 小样本细粒度图像分类任务中,由于支持样本与查询样本之间缺少局部关联性,导致图像关键可区分区域不易精确定位。针对这一问题,提出了多尺度知识引导局部增强的小样本细粒度图像分类方法,采用图像金字塔向下降低采样率获得多个不同分辨率的子图作为输入图像,融合多尺度特征,丰富了样本信息,利用知识引导模块捕获支持样本和查询样本之间的语义相关性,增强了支持样本重要区域的特征表示,对支持样本和查询样本的嵌入特征图进行克罗内克积操作,生成的空间相关图,更精确地定位样本特征之间的位置对应关系,突出了辨别性区域。实验结果表明该方法在小样本细粒度图像分类任务中表现出较好的分类性能。 2024年09月05 00:00 2024年5期 1157 1167 5903248 李小菲, 苟光磊, 韩岩奇, 朱东华 基于MobileViT和多尺度特征聚合的遥感图像目标检测 /oa/darticle.aspx?type=view&id=202310022 针对遥感图像目标检测存在复杂背景干扰、微小目标提取难和目标多尺度差异问题,提出一种基于MobileViT和多尺度特征聚合的遥感图像目标检测算法(FWM-YOLOv7t)。首先设计多尺度特征聚合模块,建立遥感目标上下文依赖关系,提升多尺度目标和小目标检测精度;然后利用MobileViT模块,融合卷积神经网络和视觉Transformer优点,有效编码局部和全局信息,抑制非目标噪声干扰;最后引入Wise-IoU损失函数,重点关注普通质量锚框,提高算法检测性能。在公共数据集RSOD和NWPU VHR-10上的实验结果表明,FWM-YOLOv7t能够显著提升遥感图像目标检测的平均准确率。与其他目标检测算法相比,FWM-YOLOv7t对复杂背景目标、小目标和多尺度目标的检测更有效。 2024年09月05 00:00 2024年5期 1168 1177 5881166 梁礼明, 冯耀, 龙鹏威, 李仁杰 使用掌纹线对基于深度学习的掌纹识别进行数据增强 /oa/darticle.aspx?type=view&id=202308026 近年来掌纹识别技术受到越来越多的关注,然而在掌纹识别的过程中,复杂的应用场景为识别带来了困难。在基于深度学习的掌纹识别算法中,数据增强操作具有较大的作用。由于掌纹的独特性,其所包含的特征信息几乎全部处于掌纹线之中,因此传统的全局数据增强方法收效甚微。本文提出了一种基于掌纹线的数据增强方法。该方法首先基于传统的图像处理方法,提出了多阶段的掌纹线提取算法。然后,基于提取的掌纹线,设计了一种掌纹识别的数据增强方案。通过实验表明,应用该数据增强方式对掌纹图像进行增强之后,在4个广泛应用的深度学习模型上都取得了更好的效果。该数据增强方法简单高效,能够在实际应用中发挥作用。 2024年09月05 00:00 2024年5期 1178 1189 4877715 金怡凡, 王海涛, 贾伟 面向掌纹掌静脉识别网络轻量化的非对称双模态融合方法 /oa/darticle.aspx?type=view&id=202212031 深度学习已在掌纹掌静脉领域广泛应用,但随着任务使用场景的不断微型化、终端化,现有的深度学习模型往往难以在算力匮乏、内存有限的边缘设备上顺利部署。本文基于知识蒸馏方法提出了轻量化的掌纹掌静脉识别网络。根据模态特征提取复杂程度,为掌纹与掌静脉模态分别选用不同的网络深度。在常规知识蒸馏方法中引入新设计的模态特征损失函数,强化教师模型对各模态特征提取的指导作用。实验结果表明,该方法有效协调了模型大小与性能,为边缘计算环境下的生物特征识别技术提供了一种有效的解决方案。 2024年09月05 00:00 2024年5期 1190 1198 4970012 林孙旗<sup>1</sup>, 徐家梦<sup>2</sup>, 郑瑜杰<sup>1</sup>, 王翀<sup>1,2</sup>, 王军<sup>2</sup> 基于双向生成对抗网络的工业过程故障检测 /oa/darticle.aspx?type=view&id=202306011 标准双向生成对抗网络的模型结构由全连接层构成,在进行故障检测时仅使用单个样本的过程特征进行统计量构建。因此,提出了一种改进双向生成对抗网络的工业过程故障检测方法。该方法用降噪自编码器对样本进行预处理,构建重构误差作为双向生成对抗网络的输入,以减少异常样本中正常信息对异常信息的淹没,增强模型对微小故障的检测能力;并将长短时编解码器引入双向生成对抗网络模型中,使得生成器在生成虚假样本的同时还可以关注当前时刻样本的过程特征和历史时刻样本间的关联性,增强了模型对时间序列数据的检测能力。将所提故障检测方法应用于田纳西伊斯曼过程和实际磨煤机工业过程,其在保证低误报率的同时,提升了报警率,并且具有良好的泛化性能。 2024年09月05 00:00 2024年5期 1199 1208 5552790 牟建鹏<sup>1</sup>, 刘文韬<sup>1</sup>, 熊伟丽<sup>1,2</sup> 基于改进RRT*算法的移动机器人路径规划 /oa/darticle.aspx?type=view&id=202302010 针对传统快速随机搜索树*(rapidly-exploring random tree*, RRT*)算法收敛速率较慢,且不适用于动态场景等问题,提出一种基于目标点偏置和冗余节点删除的改进RRT*算法,用于解决移动机器人快速找到无碰撞最优路径的问题。此算法在RRT*算法基础上,首先对采样点进行优化处理,保证路径最优的同时减少搜寻时间;其次引入路径节点最大值概念,删除扩展树冗余节点以提高算法效率;最后结合动态窗口(dynamic window approaches, DWA)算法提高路径的安全性和平滑性,实现对动态障碍物的避障。通过3种不同地图下的仿真验证,改进算法能有效提升路径质量,且大幅降低运行时间。 2024年09月05 00:00 2024年5期 1209 1217 3546823 郭利进, 李强 时空融合与判别力增强的孪生网络目标跟踪方法 /oa/darticle.aspx?type=view&id=202306005 孪生跟踪器的出现极大提升了跟踪任务性能。然而,当前跟踪器难以精准描述目标外观变化,造成面临遮挡和尺度变化等挑战时的性能衰减。另外,杂乱背景会产生干扰响应图,误导目标定位。为此,引入2个基于Transformer的跟踪模块用于提高孪生跟踪器性能。其中时空融合模块使用交叉注意力机制的全局特征关联,迭代累积历史线索从而提高目标外貌变化的鲁棒性。判别力增强模块关联目标和搜索区域的语义信息,以提高目标判别能力。此外,使用空间通道加权特征融合,充分发掘空间分布和语义相似性的时空信息。所提模块可嵌入主流孪生跟踪器,在公开数据集上的实验证明了方案的优越性。 2024年09月05 00:00 2024年5期 1218 1227 6258579 黄昱程<sup>1</sup>, 肖子旺<sup>1</sup>, 武丹凤<sup>2</sup>, 艾斯卡尔·艾木都拉<sup>1</sup> 融合边缘感知与统计纹理知识的输电线路金具锈蚀检测 /oa/darticle.aspx?type=view&id=202306009 针对输电线路金具目标小、背景环境复杂和锈蚀区域不规则等问题,提出了一种融合边缘感知与统计纹理知识的输电线路金具锈蚀检测算法。首先通过改进YOLOv7模型检测金具,然后利用改进Res-UNet模型对检测的金具进行锈蚀分割,加入SE(squeeze-excitation)注意力提高模型的稳定性,引入统计纹理知识模块(statistical texture knowledge module, STM)和边缘感知模块(edge-aware module, EAM),提出一种知识融合模块对边缘感知和统计纹理知识进行融合,提高对锈蚀分割精度。实验结果表明,检测和分割模型mAP分别提高了2.8百分点和7.7百分点。 2024年09月05 00:00 2024年5期 1228 1237 5157354 赵振兵<sup>1</sup>, 郭广学<sup>1</sup>, 王艺衡<sup>1</sup>, 赵文清<sup>2</sup>, 翟永杰<sup>2</sup> 面向未知域场景的车辆轨迹预测模型 /oa/darticle.aspx?type=view&id=202306046 自动驾驶技术随着科技革新迎来蓬勃发展,轨迹预测已成为智能汽车软件系统不可或缺的关键组成部分。为了解决传统车辆轨迹预测模型中存在的泛化能力不足的问题,提出一种基于泛化终点预测和地图场景的车辆轨迹预测方法。该方法采用基于不变风险最小化的条件变分自编码器生成轨迹终点,并结合时序网络编码的地图场景特征,提升了模型预测未知域数据的准确率。在交互式道路场景数据集INTERACTION上的实验结果证明该模型具有良好的泛化性能。本方法与效果最好的方法REx相比1 、2 、3 s处的mADE值(越小越好)分别下降0%、36.59%、50.68%,在未知测试域的预测轨迹准确度得到显著提升。 2024年09月05 00:00 2024年5期 1238 1247 4853477 卢一凡, 李煊鹏, 薛启凡 抗遮挡的行人多目标跟踪算法 /oa/darticle.aspx?type=view&id=202307002 为了解决在复杂场景下行人相互遮挡导致跟踪系统精度降低的问题,提出了基于FairMOT的抗遮挡多目标跟踪算法(multiple obeject tracking algorithm with anti-occlusions, AOMOT)。首先通过轻量化平衡模块,解耦不同层次的语义信息,减少检测任务和重识别任务的语义冲突,降低重识别任务的性能提升对检测任务的影响。其次应用自注意力结构提取行人的外观特征,加强局部窗口下的类内特征的区分度,增强行人身份信息的匹配一致性并减少身份标识的频繁切换。最后优化身份关联算法,挖掘低置信度目标中的被遮挡对象,将其重新纳入目标身份关联并更新其重识别特征。实验结果表明,AOMOT相比原有FairMOT在MOT17数据集中高阶跟踪精度提升1.5百分点,身份F1分数提升3百分点,身份切换数量降低32%。 2024年09月05 00:00 2024年5期 1248 1256 5467225 张国印, 王传博, 高伟 基于三元互信息的图对比学习方法研究 /oa/darticle.aspx?type=view&id=202308004 最近,图对比学习成为一种成功的无监督图表示学习方法,大多数方法都基于最大化互信息原则,通过数据增强来得到两个视图,并最大化两个视图的互信息。然而,两个视图的互信息可能包含不利于下游任务的信息。为了克服这些缺陷,提出基于三元互信息的图对比学习框架。该框架首先对输入图进行随机数据增强来生成两个视图,使用权重共享的编码器获得两个节点表示矩阵,随后使用共享权重解码器解码两个视图的节点表示。通过对比损失函数分别计算视图之间和视图与原图之间的损失,以最大化视图之间和视图与原图之间的互信息。实验结果表明,该方法在节点分类准确性方面的表现优于基线方法,甚至超过部分监督学习方法,验证了框架的有效性。 2024年09月05 00:00 2024年5期 1257 1267 5306157 李旭, 蔡彪, 胡能兵 图神经网络和数值诱导正则化的数值推理方法 /oa/darticle.aspx?type=view&id=202308045 数值推理是机器阅读理解的一项关键能力,而数值推理任务中的数据类型多样,数值之间潜在的运算关系对数值推理任务有着更高的要求。为了进一步提升数值推理能力,一方面继承图神经网络方法并探索新的图结构,采用异构图神经网络结构进行数值推理,另一方面在预训练语言模型中引入数值诱导正则化方法,增强模型的数值理解能力。在DROP数据集上实验的结果表明,2种方法得到76.5%的精准匹配率,与基线模型对比以及对方法的消融实验表明,上述2种方法能够提升机器的数值推理能力。 2024年09月05 00:00 2024年5期 1268 1276 4597856 白宇康<sup>1</sup>, 陈彦敏<sup>1,2</sup>, 樊小超<sup>1</sup>, 孙睿军<sup>2</sup>, 李炜杰<sup>3</sup> 融合双注意力机制的GNN多维时间序列预测 /oa/darticle.aspx?type=view&id=202305020 针对现有多维时间序列数据(multivariate time series, MTS)预测中变量间依赖关系捕获能力不足和时间序列数据多通道信息利用不充分的问题,提出一种融合双注意力机制的多维时间序列预测模型(feature fusion and dual attention mechanism based GNN, FFDA-GNN)。该模型将图神经网络与空间注意力机制融合,用于增强多变量之间依赖关系捕获能力;利用并行的多层膨胀卷积和通道注意力机制,对时间序列数据进行多通道的特征提取,实现对时间序列数据多通道信息的充分利用,从而提升预测性能。在经济、电力、交通3个领域数据集上与基准模型进行对比实验,该模型预测精度优于其他基准方法,有良好的可行性。 2024年09月05 00:00 2024年5期 1277 1286 4681668 范航舟, 梅红岩, 赵勤, 张兴, 程耐 基于多层次知识增强的方面级情感分析模型 /oa/darticle.aspx?type=view&id=202308044 在方面级情感分析任务中,现有研究侧重于挖掘评论语句的语义信息和句法依赖约束,未能综合考虑情感知识、概念知识和单词之间的句法依赖类型对方面情感倾向判别准确性的影响。针对这一问题,提出一种基于多层次知识增强的方面级情感分析模型(multilevel knowledge enhancement,MLKE),利用外部知识对评论语句进行情感、句法和概念3个层次的知识增强。首先,利用情感知识及单词之间的依赖类型来增强句子的依赖图,并通过图卷积网络建模节点特征,得到情感和句法增强的特定方面表征;其次,利用概念图谱对方面词概念增强后,与特定方面表征进行融合,得到多层次知识增强的方面表征;最后,采用交互注意力机制实现上下文表征与方面表征之间的协调优化。5个公共数据集上的实验结果表明,所提模型的准确率和宏<i>F</i><sub>1</sub>值均得到提高。 2024年09月05 00:00 2024年5期 1287 1297 4879181 段文杰<sup>1,2</sup>, 邓金科<sup>1,2</sup>, 张顺香<sup>1,2,3</sup>, 李书羽<sup>1,2</sup>, 周若彤<sup>1,2</sup> 基于特征重用和膨胀卷积的遥感图像舰船检测 /oa/darticle.aspx?type=view&id=202304002 在光学遥感图像中,港口内的舰船目标通常处于密集的船只群中,并受到周围环境的干扰和遮挡,如集装箱、车辆等。为了进一步提高现有舰船目标检测算法的精度和泛化性能,提出了一种基于特征重用和膨胀卷积的遥感图像舰船检测算法。首先构建了基于分组卷积和拆分注意力的残差块来提取特征,同时嵌入可变形卷积提取更加符合舰船尺度变化的特征;接着,构造了多尺度感受野模块,通过并行提取多尺度特征后再进行融合来减少信息损失;最后,在原有特征金字塔的基础上构建了一条自底向上的特征重用聚合路径以提高特征表示能力。在大型遥感数据集DOTA和舰船数据集HRSC2016上进行实验,实验结果表明,所提方法能够有效缓解舰船目标漏检和误检问题,提高了遥感图像舰船目标检测的精度。 2024年09月05 00:00 2024年5期 1298 1308 7673843 曲海成, 李瑞柯, 王蒙, 单以盟 一种注意力机制LSTM的5G网络地铁节电方法 /oa/darticle.aspx?type=view&id=202403038 随着5G网络的规模化建设应用,5G基站设备的大功耗及高能耗成为运营商急需解决的成本问题。针对该问题,提出了一种基于注意力机制LSTM的5G网络地铁节电方法,该方法首先根据地铁特殊业务场景通过特征工程建立了与5G业务场景相关联的业务关键特征,为了尽可能挖掘长时序特征,建立了基于注意力机制的LSTM时序预测模型,实现了小时粒度5G基站业务量的精确预测;其次基于多项式回归模型建立了5G地铁业务量与基站配置量的函数模型,形成节电策略。最后,实现5G基站节电效能的有效评估,通过建立5G基站用电量与基站设备BBU、HUB、RRU等硬件设备功耗函数模型,实现节电策略实施后节电效能的有效评估。实验结果表明,对比传统的5G电力供应模型,该方法能够节省43%的电能。 2024年09月05 00:00 2024年5期 1309 1318 4113975 邓翠艳<sup>1</sup>, 齐小刚<sup>2</sup> 基于傅里叶频域截断的神经辐射场优化 /oa/darticle.aspx?type=view&id=202401036 神经辐射场(neural radiance fields, NeRF)作为一种通用的场景表达方法,可以更好地理解三维世界的同时创造出更加逼真的感官体验。然而在实际应用中,输入图像较少导致重建效果不佳是一个常见的问题。为此,本文提出了基于傅里叶频域截断的神经辐射场(sparse views neural radiance fields, Sv-NeRF),通过在频域空间对输入频率进行截断并应用正则化策略来控制高频信号的输入来优化NeRF的位置编码机制,有效地降低了高频噪声,保留了关键的细节信息以提升渲染的质量和稳定性。该方法提升了模型对场景的理解能力,相较于现有方法在渲染质量、细节保留能力上均有显著提升,尤其适用于稀疏输入视角的场景重建工作。 2024年09月05 00:00 2024年5期 1319 1330 4824638 殷泽众<sup>1,2</sup>, 郭茂祖<sup>1,2</sup>, 田乐<sup>1,2</sup> 基于分层联邦框架的音频模型生成技术研究 /oa/darticle.aspx?type=view&id=202306054 针对音频模型,围绕下一代音频生成技术研究,构建联邦音频模型训练框架,面向超大规模音频数据进行音频表征学习,为音频下游任务提供高效鲁棒的解决方案。提出一种适用于音频模型的联邦学习框架,解决数据异构性、通信效率、隐私保护等问题;提出一种基于对比学习的音频模型的预训练方法,利用&lt;音频,文本描述&gt;数据学习语义特征,提高模型的泛化能力和多样化能力;提出一种基于提示学习的音频生成微调方法,利用少量标注数据提高模型的适应能力和定制化能力;提出一种音频模型分布式优化算法进行模型压缩,降低模型的复杂度和资源消耗,提高模型的部署效率和运行效率。通过在下游任务音效转换上的实验,提出的方法在语音质量平均意见得分可以达到3.81。实验结果表明,该方法在音效转换任务上取得了良好的效果。 2024年09月05 00:00 2024年5期 1331 1339 4439430 王健宗<sup>1</sup>, 张旭龙<sup>1</sup>, 姜桂林<sup>2</sup>, 程宁<sup>1</sup>, 肖京<sup>1</sup>