智能系统学报 /oa 生命的意义 /oa/darticle.aspx?type=view&id=202507013 2025年05月05 00:00 2025年3期 529 595532 李德毅 医疗领域的大型语言模型综述 /oa/darticle.aspx?type=view&id=202405003 深度学习是人工智能领域的热门研究方向之一,它通过构建多层人工神经网络模仿人脑对数据的处理机制。大型语言模型(large language model,LLM)基于深度学习的架构,在无需编程指令的情况下,能通过分析大量数据以获得理解和生成人类语言的能力,被广泛应用于自然语言处理、计算机视觉、智慧医疗、智慧交通等诸多领域。文章总结了LLM在医疗领域的应用,涵盖了LLM针对医疗任务的基本训练流程、特殊策略以及在具体医疗场景中的应用。同时,进一步讨论了LLM在应用中面临的挑战,包括决策过程缺乏透明度、输出准确性以及隐私、伦理问题等,随后列举了相应的改进策略。最后,文章展望了LLM在医疗领域的未来发展趋势,及其对人类健康事业发展的潜在影响。 2025年05月05 00:00 2025年3期 530 547 4584769 肖建力<sup>1</sup>, 许东舟<sup>1</sup>, 王浩<sup>2</sup>, 刘敏<sup>3</sup>, 周雷<sup>4</sup>, 朱林<sup>4</sup>, 顾松<sup>5</sup> 基于分层多智能体强化学习的多无人机视距内空战 /oa/darticle.aspx?type=view&id=202408008 为提高无人机在视距内空战中的自主机动决策能力,本文提出一种基于自博弈理论(self-play,SP)和多智能体分层强化学习(mutil agent hierarchical reinforcement learning,MAHRL)的层次决策网络框架。该框架通过结合自身博弈和多智能体强化学习算法,研究了多无人机空战缠斗场景。复杂的空战任务被分解为上层导弹打击任务和下层飞行跟踪任务,有效地减少了战术行动的模糊性,并提高了多无人机空战场景中的自主机动决策能力。此外,通过设计新颖的奖励函数和采用自博弈方法,减少了大型战场环境导致的无意义探索。仿真结果表明,该算法不仅有助于智能体学习基本的飞行战术和高级的作战战术,而且在防御和进攻能力上优于其他多智能体空战算法。 2025年05月05 00:00 2025年3期 548 556 4719237 雍宇晨<sup>1,2</sup>, 李子豫<sup>3</sup>, 董琦<sup>2</sup> 基于伪标签细化的域适应TSK模糊分类器 /oa/darticle.aspx?type=view&id=202408015 Takagi-Sugeno-Kang (TSK)模糊分类器由于其良好的分类性能和可解释性在多个领域有着广泛的应用。针对训练样本和测试样本分布差异所导致的TSK模糊分类器泛化性能下降问题提出了一种基于伪标签细化的域适应TSK模糊分类器。该分类器使用模糊规则前件的非线性映射和后件的线性映射能力构建源域和目标域数据的模糊共享特征空间,并在模糊共享特征空间采用基于图随机游走和标签过滤细化两种策略来提升目标域伪标签质量来更好地进行域对齐。通过在多个公开数据集上的广泛实验,验证了所提出的域适应TSK模糊分类器不仅具备可靠的分类性能,还具有良好的可解释性。 2025年05月05 00:00 2025年3期 557 570 5036152 张馨匀<sup>1</sup>, 周琳家<sup>1</sup>, 程煜婷<sup>1</sup>, 邱成羽<sup>1</sup>, 谢宇航<sup>1</sup>, 陈秀<sup>1</sup>, 张远鹏<sup>1,2</sup> 基于自优化神经网络的船舶运动模型辨识 /oa/darticle.aspx?type=view&id=202408004 精确的船舶运动模型是船舶自主系统的核心。为提高船舶运动建模精度,引入了改进的雪融优化器(improved snow ablation optimizer, ISAO);提出一种结合双向时间卷积网络(bidirectional temporal convolutional network, Bi-TCN)与注意力机制(attention mechanism, AM)的网络模型,即BITCA。进一步地,将ISAO与BITCA相结合,建立ISAO-BITCA船舶运动辨识混合模型。该模型利用Bi-TCN深度挖掘船舶运动序列在双向时间及空间维度下的隐藏特征,并引入AM以减少信息损失;基于ISAO,自主搜索并优化了BITCA模型的超参数组合。仿真实验结果表明,经过ISAO优化的BITCA模型在船舶航向角、偏航角速度、横摇角和总速度预测上的均方根误差(root mean square error, RMSE)分别降低了54.1%、28.21%、5.88%和40%,为船舶运动模型的准确辨识提供了一种有效手段。 2025年05月05 00:00 2025年3期 571 583 6565571 张浩晢<sup>1</sup>, 杨智博<sup>1</sup>, 焦绪国<sup>1</sup>, 吕成兴<sup>1</sup>, 朱齐丹<sup>2</sup> 基于混合邻域图的复杂结构数据集层次聚类算法 /oa/darticle.aspx?type=view&id=202407001 复杂结构数据集通常指包含不同形状(如球形、非球形、流形)、大小和密度的簇的数据集。自然邻居算法在处理边界模糊、密度变化的数据集时存在局限性,特别是在数据集中含有大量噪声时,其性能会显著下降。针对这些问题,本文提出一种基于混合邻域图的复杂结构数据集层次聚类算法(hybrid neighborhood graph-based hierarchical clustering algorithm for datasets with complex structures, HCHNG)。该方法提出一种共享自然邻域图方法,通过邻居关系稀疏数据集以减少噪声样本对聚类结果的影响。随后,HCHNG将数据集划分为子图并加以合并,这一策略增强了算法处理变密度数据集的能力,同时,定义一种新的子图相似性度量方法,提高同类子图间的相似性。此外,对自然邻域图进行改进,以提升其在识别边界模糊数据集时的性能。在具有复杂结构的人工数据集和真实数据集上的对比实验表明,本文算法不仅能有效识别变密度球形数据集,而且在含有大量噪声的复杂数据集中也拥有优越的性能,在处理具有复杂结构的数据集时比现有方法高效。 2025年05月05 00:00 2025年3期 584 593 4716936 陈仲尚, 冯骥, 杨德刚, 蔡发鹏 基于L<sub>1</sub>-mask约束的对抗攻击优化方法 /oa/darticle.aspx?type=view&id=202405037 当前的对抗攻击方法通常采用无穷范数或L<sub>2</sub>范数来度量距离,但在不可察觉性方面仍有提升空间。L<sub>1</sub>范数作为稀疏学习的常用度量方式,其在提高对抗样本的不可察觉性方面尚未被深入研究。为了解决这一问题,提出基于L<sub>1</sub>范数约束的对抗攻击方法,通过对特征进行差异化处理,将有限的扰动集中在更重要的特征上。此外,还提出了基于显著性分析的L<sub>1</sub>-mask约束方法,通过遮盖显著性较低的特征来提高攻击的针对性。这些改进不仅提高了对抗样本的不可察觉性,还减少了对抗样本对替代模型的过拟合风险,增强了对抗攻击的迁移性。在ImageNet-Compatible数据集上的实验结果表明:在保持相同黑盒攻击成功率的条件下,基于L<sub>1</sub>约束的对抗攻击方法不可察觉性指标FID(frechet inception distance)指标较无穷范数低约5.7%,而基于L<sub>1</sub>-mask约束的FID指标则低约9.5%。 2025年05月05 00:00 2025年3期 594 604 6301090 周强, 陈军, 陶卿 基于主干网络浅深层特征的无人机海上分割算法 /oa/darticle.aspx?type=view&id=202405021 为提高复杂海洋环境中无人机自主降落时分割目标的实时性和精确性,研究主干网络和浅深层特征对分割算法性能的影响问题,基于DeepLabV3+框架建立一种基于主干网络浅深层特征的无人机海上分割(shallow and deep features of backbone, SDFB)算法。首先,针对风浪扰动降低目标稳定性的问题,优化MobileNetV2结构提出一种特征提取方法,解决了算法无法处理短时间目标变化较大图像的问题;然后,针对深层特征输出通道数较多且存在不均匀分布大气湍流噪声的问题,利用本地全局信息选择性地聚合特征,提出一种特征筛选机制,剔除冗余通道的同时解决了算法对环境噪声敏感度高的问题;其次,针对光照不匀降低目标边界清晰度问题,从浅层空间维度和深层通道维度中提取轮廓信息建立一种并行轮廓学习机制,解决了算法利用轮廓特征效率低的问题;最后,针对障碍物遮挡破坏目标特征完整性问题,融合优化后的条带池化建立一种特征融合机制,解决了算法无法联系离散分布特征问题。实验表明,SDFB算法的实时性和精确性均高于其他算法,能够更好地适应海上场景无人机分割目标需求。 2025年05月05 00:00 2025年3期 605 620 5587721 沈昊<sup>1</sup>, 葛泉波<sup>2,3,4</sup>, 吴高峰<sup>2</sup> 基于特征融合和网络采样的点云配准 /oa/darticle.aspx?type=view&id=202403022 针对点云配准过程中,下采样时容易丢失关键点、影响配准精度的问题,本文提出一种基于特征融合和网络采样的配准方法,提高了配准的精度和速度。在PointNet分类网络基础上,引入小型注意力机制,设计一种基于深度学习网络的关键点提取方法,将局部特征和全局特征融合,得到混合特征的特征矩阵。通过深度学习实现对应矩阵求解中相关参数的自动优化,最后利用加权奇异值分解(singular value decomposition,SVD)得到变换矩阵,完成配准。在ModelNet40数据集上的实验表明,和最远点采样相比,所提算法耗时减少45.36%;而配准结果和基于特征学习的鲁棒点匹配(robust point matching using learned features,RPM-Net)相比,平移矩阵均方误差降低5.67%,旋转矩阵均方误差降低13.1%。在自制点云数据上的实验,证实了算法在真实物体上配准的有效性。 2025年05月05 00:00 2025年3期 621 630 4784147 陆军, 王文豪, 杜宏劲 面向复杂电力环境场景理解的可见光和红外图像特征级融合方法 /oa/darticle.aspx?type=view&id=202404014 随着电力系统自动化和智能化程度的不断提高,变电站和配电网设备的有效监测与故障诊断成为保证电网稳定运行的重要手段。针对传统单模态图像处理方法在复杂电力环境中面临的挑战,本文提出了一种基于可见光和红外图像特征级融合的场景理解方法。通过深入分析可见光图像和红外图像的互补特性,设计了一个双分支的对称融合网络框架,有效结合了可见光图像的高分辨率纹理信息和红外图像的温度信息。此外,引入多尺度特征融合层和多尺度注意力解码器,以提高模型的分割精度和细节恢复能力。实验结果表明,该方法在变电站设备监测中取得了优异的性能,尤其是在处理光照不足和遮挡情况下的图像时,展现出了较好的鲁棒性。该研究不仅为复杂电力环境的监测提供了一种有效的技术手段,而且对于推动电力系统智能化管理具有重要的理论和实践意义。 2025年05月05 00:00 2025年3期 631 640 4870257 黄志鸿<sup>1,2</sup>, 杜瑞<sup>3</sup>, 张辉<sup>3</sup> 高低频特征融合的低照度图像增强方法 /oa/darticle.aspx?type=view&id=202405026 针对现有低照度图像增强方法中性能与开销不平衡的问题,本文提出一种高低频特征融合的低照度图像增强方法。该方法在多尺度上提取几何特征丰富的低频特征与语义特征丰富的高频特征,经过高低频特征融合得到增强图像,在保证良好图像质量的同时降低开销。为提升低照度环境下的特征提取能力,构建残差混合注意力模块,从像素与通道两方面对重要的局部区域给予更多关注。针对下采样导致的信息丢失问题,提出一种特征合并模块对下采样后的特征进行特征补充。此外,通过多级残差密集连接模块增强特征复用能力。在SID(see-in-the-dark)数据集上的实验表明,该方法峰值信噪比和结构相似度分别达到29.67和0.792,模型参数量仅为1.5×10<sup>6</sup>。 2025年05月05 00:00 2025年3期 641 648 5032407 王德文<sup>1,2</sup>, 胡旺盛<sup>1</sup>, 张润磊<sup>1</sup>, 赵文清<sup>1,3</sup> 基于混合双分支卷积神经网络和图卷积神经网络的全色锐化方法 /oa/darticle.aspx?type=view&id=202401003 多光谱图像全色锐化是遥感影像处理与解译领域的热点问题。相较于传统全色锐化方法,基于深度学习的全色锐化方法聚焦于图像深层次特征的提取,大幅提升了融合图像的质量。本文提出一种基于混合双分支卷积神经网络和图卷积神经网络的全色锐化方法,旨在同时挖掘图像的光谱、空间与非几何结构信息,以提升融合图像空间分辨率和光谱分辨率。本方法建立在多分辨率分析融合框架的基础上,利用深度神经网络构建了特征提取、特征融合和图像重构模块。混合双分支网络模块是由2D和3D卷积神经网络构建,其中,2D卷积神经网络负责挖掘多光谱图像与全色图像的空间特征,3D卷积神经网络负责挖掘图像的光谱特征。引入了图卷积神经网络以捕捉图像图结构中节点的空间关系,从而整合非局部信息。将多光谱图像与全色图像的空间、光谱和非几何特征通过特征融合模块进行融合。将融合特征输入图像重构网络重建高质量多光谱图像。本文算法在GeoEye-1和IKONOS遥感数据上进行了实验验证,实验结果表明:与其他方法相比,本文算法在主观视觉和客观评价指标上均表现出优秀性能。 2025年05月05 00:00 2025年3期 649 657 4979855 王文卿<sup>1,2</sup>, 张小乔<sup>1</sup>, 何霁<sup>1</sup>, 刘涵<sup>1,2</sup>, 刘丁<sup>1,2</sup> 融合关键区域信息的双流网络视频表情识别 /oa/darticle.aspx?type=view&id=202401031 人脸表情识别是计算机视觉领域中的一个重要研究课题,而视频中的表情识别在很多场景下具有实用价值。视频序列包含丰富的帧内空间信息与帧间时间信息,同时面部关键区域的提取也对表情识别结果有重要影响,本文提出一种融合关键区域信息的双流网络表情识别方法。构建空间?时间双流网络,其中空间网络分支结合面部运动单元和CSFA(channel-spatial frame attention),重点关注影响表情识别结果的面部关键区域,以实现空间特征的有效提取;时间分支通过Farneback提取光流获得帧间的表情运动信息,并借助空间关键区域掩模选取降低光流计算复杂度。对空间?时间双流网络识别结果进行决策融合,得到最终视频表情识别结果。该方法在eNTERFACE’05、CK+数据集上进行实验测试,结果表明本文所提方法可有效提升识别精度,且提高了运行效率。 2025年05月05 00:00 2025年3期 658 669 6228404 孔英会<sup>1,2</sup>, 崔文婷<sup>1</sup>, 张珂<sup>1,2</sup>, 车辚辚<sup>1,2</sup> 明暗恢复形状算法改进的高精度快速水下图像三维重建方法 /oa/darticle.aspx?type=view&id=202401017 明暗恢复形状(shape from shading,SFS)算法是三维重建中不可缺少的关键技术。该方法通过单幅图像中物体的灰度的亮度信息,求出每个点的相对高度和表面法向量,现有的SFS线性化算法利用泰勒级数进行展开忽略了高阶部分的影响,导致三维重建的图像不够精确等问题。为解决三维重建精度问题,本文提出一种基于SFS算法改进的高精度快速水下图像三维重建方法,在提高三维重建精度的前提下,解决了对本轮数据利用率不够、迭代速度慢等问题。将其应用在真实图像和虚拟图像上进行实验评估以及三维重建的量化分析,验证了相比于经典 SFS 线性化算法和SFS最小化算法,本文提出的SFS算法改进的高精度快速水下图像三维重建方法,取得了令人满意的信噪比和图像信息熵值。 2025年05月05 00:00 2025年3期 670 678 4906831 管凤旭<sup>1,2</sup>, 吴卓锋<sup>2</sup>, 张雨竹<sup>1</sup>, 唐世文<sup>1</sup>, 姚佳豪<sup>1</sup>, 杜雪<sup>1</sup> 面向复杂场景的变电设备锈蚀检测方法 /oa/darticle.aspx?type=view&id=202403044 针对复杂场景下变电设备锈蚀检测中存在锈蚀形态差异大、尺度大小不一、特征显著性低等问题,提出了一种面向复杂场景的变电设备锈蚀检测方法。引入了频率通道注意力机制,通过更多的频率分量补充深层网络中的细节特征,优化模型对锈蚀特征的提取;在特征融合网络中使用多尺度特征增强模块重新构建C2f模块,使网络可以更好地捕获不同大小的锈蚀区域;引入附加检测头,缓解模型在特征融合过程中因卷积层下采样造成的锈蚀关键信息丢失的情况,从而提高变电设备锈蚀检测的精度。实验结果表明,改进以后的网络模型相较于原始的YOLOv8m模型,平均检测精度(mAP50)提升了5.1%,检测效果也优于其他主流目标检测模型,为变电设备锈蚀检测提供了新的参考方法。 2025年05月05 00:00 2025年3期 679 688 6911087 赵振兵<sup>1,2,3</sup>, 席悦<sup>1</sup>, 冯烁<sup>1</sup>, 赵文清<sup>2,4</sup>, 翟永杰<sup>4</sup>, 李冰<sup>4</sup> 基于人工势场的防疫机器人改进近端策略优化算法 /oa/darticle.aspx?type=view&id=202407026 针对防疫机器人在复杂医疗环境中的路径规划与避障效果差、学习效率低的问题,提出一种基于人工势场的改进近端策略优化(proximal policy optimization, PPO)路径规划算法。根据人工势场法(artificial potential field, APF)构建障碍物和目标节点的势场,定义防疫机器人的动作空间与安全运动范围,解决防疫机器人运作中避障效率低的问题。为解决传统PPO算法的奖励稀疏问题,将人工势场因子引入PPO算法的奖励函数,提升算法运行中的奖励反馈效率。改进PPO算法网络模型,增加隐藏层和Previous Actor网络,提高了防疫机器人的灵活性与学习感知能力。最后,在静态和动态仿真环境中对算法进行对比实验,结果表明本算法能更快到达奖励峰值,减少冗余路径,有效完成避障和路径规划决策。 2025年05月05 00:00 2025年3期 689 698 5007047 伍锡如, 沈可扬 基于事件触发灰狼优化算法的四旋翼无人机三维航迹规划 /oa/darticle.aspx?type=view&id=202406013 针对复杂环境下四旋翼无人机三维航迹规划问题,提出了一种改进的事件触发灰狼优化算法(event triggered grey wolf optimization,ETGWO)。引入球面矢量刻画飞行路径的生成,通过减少搜索空间提升搜索能力;设计自适应权重动态调整飞行航迹成本适应度函数,以提高航迹规划效率和准确性;在灰狼优化算法(grey wolf optimization,GWO)基础上,选择使用改进的非线性收敛因子,提升算法的鲁棒性;为了更好地平衡算法的全局搜索和局部搜索能力,通过引入基于事件触发机制的灰狼个体位置更新速度来改进GWO算法的位置更新策略。仿真对比实验表明,所提出ETGWO算法在四旋翼无人机(quadrotor unmanned aerial vehicles, QUAV)飞行航迹规划方面具有更优越的性能。 2025年05月05 00:00 2025年3期 699 706 5689656 秦冬燕, 闫晓辉, 邵桂伟, 姚玉武 考虑运输和机器预维护的柔性作业车间调度研究 /oa/darticle.aspx?type=view&id=202405020 航空制造业的快速发展,对高效率和低能耗生产模式的需求愈发迫切。通过综合分析考虑运输和预维护的航空复合材料柔性作业车间调度问题,建立了以最小化完工时间、瓶颈机器负载和总能耗为目标的模型,提出了一种基于种群质量的非支配排序遗传算法(nondominated sorting genetic algorithm II,NSGA-II)。采用启发式初始化方法产生高质量的初始种群,对个体进行分组进化:对优质种群进行局部搜索,深度挖掘种群的最优个体;中等种群通过交叉变异和机器负载操作改变自身部分基因来挖掘最优解;劣质种群则通过学习机制获取优质个体的优秀基因,提升个体优良率。通过测试算例与对比算法的比较验证了所提算法的有效性。最后,将算法应用于实际的航空制造系统,实现了实际生产活动的调度,验证了算法的可行性。 2025年05月05 00:00 2025年3期 707 718 4432031 王玉芳<sup>1,2,3</sup>, 张毅<sup>1</sup>, 姚彬彬<sup>1</sup>, 陈凡<sup>1</sup>, 葛师语<sup>1</sup> 卷积神经网络在图像超分辨上的应用 /oa/darticle.aspx?type=view&id=202409027 卷积神经网络因强大的学习能力,已成为解决图像超分辨问题的主流方法。然而,用于解决图像超分辨的不同类型深度学习方法存在巨大的差异。目前,仅有少量文献能根据不同缩放方法来总结不同深度学习技术在图像超分辨上的区别和联系。因此,根据设备的负载能力和执行速度等介绍面向图像超分辨方法的卷积神经网络尤为重要。本文首先介绍面向图像超分辨的卷积神经网络基础,随后通过介绍基于双三次插值、最近邻插值、双线性插值、转置卷积、亚像素层、元上采样的卷积神经网络的图像超分辨方法,分析基于插值和模块化的卷积神经网络图像超分辨方法的区别与联系,并通过实验比较这些方法的性能。本文对潜在的研究方向和挑战进行阐述并总结全文,旨在促进基于卷积神经网络的图像超分辨研究的发展。 2025年05月05 00:00 2025年3期 719 749 5331109 田春伟<sup>1,2</sup>, 宋明键<sup>3</sup>, 左旺孟<sup>1</sup>, 杜博<sup>4</sup>, 张艳宁<sup>2,5</sup>, 张师超<sup>6</sup> 基于短时傅里叶变换的智能音乐生成系统分析与研究 /oa/darticle.aspx?type=view&id=202405043 在基于短时傅里叶变换(short-time Fourier transform, STFT)的智能音乐生成系统中,引入梅尔倒谱系数(Mel frequency cepstrum coefficient, MFCC)作为输入特征,并对STFT的损失函数进行优化设计,以提升音乐生成的质量。在对音符输入信号进行短时傅里叶变换时,需要对时域信号进行截断并添加窗函数,对信号添加时域窗等效于在频域信号中进行卷积。时域信号在截断过程中存在频谱分析误差,使得频谱以实际频率值为中心,以窗函数频谱波形的形状向两侧扩散,从而产生频谱泄漏。不同窗函数的选择对最终生成音乐的品质具有显著影响。为此,提出一种基于能量校正因子、频域最大副瓣和主瓣增益的窗函数分析与选择方法,并开发相应脚本工具,从而完成基于符号域音乐的混合窗函数设计。实验结果表明,混合窗函数在不同的MIDI(musical instrument digital interface)数据集上均可有效减少频谱泄漏对信号截断的影响,具有很好的适应性和灵活性,从而更好地作用于基于STFT的智能音乐生成系统中。 2025年05月05 00:00 2025年3期 750 760 5440368 李一熙<sup>1</sup>, 汪镭<sup>1</sup>, 薛愈<sup>2</sup>, 吴启迪<sup>1</sup>