智能系统学报

人工智能已成为网络空间安全发展的关键变量

冯登国 — 2025年03月05 00:00

扩散模型在计算机视觉领域的研究现状

管凤旭, 张涵宇, 路斯棋, 赖海涛, 杜雪, 郑岩 — 2025年03月05 00:00

扩散模型是受分子热力学启发而来的一类新的生成模型，具有训练稳定、对模型设置依赖性弱等优点。近年来，扩散模型被广泛应用于各项任务，并且取得了相比于以往生成模型更多样、更高质量的结果。目前，扩散模型已成为计算机视觉领域热门的基准方法。为更好地促进扩散模型在计算机视觉领域的发展，对扩散模型进行综述：首先对比了扩散模型与其他生成模型的优劣，介绍了扩散模型的数学原理；随后，从扩散模型存在的普遍问题出发，介绍了相关学者近年来所做的改进工作，以及扩散模型在多种视觉任务上的应用实例；最后，探讨了扩散模型存在的问题，并提出了一些未来可能的发展趋势。

基于深度学习的图像篡改检测方法综述

2025年03月05 00:00

随着数字图像编辑工具的普及，图像篡改变得越来越容易，大量被篡改后的虚假图像通过网络和社交媒体进行传播，这对法律、新闻媒体和科学研究等领域的真实性和可信度构成了威胁。图像篡改检测的目的是检测和定位篡改图像中的篡改区域，以保护图像的可信度。本文对基于深度学习的篡改检测方法进行了回顾总结。首先，介绍了目前图像篡改检测领域的研究现状。其次，对近5年的深度学习方法进行了分类整理。然后，介绍了主要的数据集和评价指标，以及各种方法的性能对比。最后，探讨了目前篡改检测方法的局限性并对未来的发展方向进行了展望。

从随机集落影到随机点落影——隶属函数用于机器学习

汪培庄, 鲁晨光 — 2025年03月05 00:00

从样本分布求得隶属函数是重要的也是困难的。汪培庄的随机集落影理论使用集值统计得到隶属函数，从而在统计和模糊逻辑之间架起桥梁。但是，通常的样本并不包含集值，所以该理论不够实用。鲁晨光使用语义信息方法推导出用样本分布优化隶属函数的2个公式，它们和集值统计结果一致，可谓随机点落影方法。该方法可以用于多标签分类、最大互信息分类、混合模型、贝叶斯确证等。深度学习最新潮流中用的相似函数和估计互信息就是隶属函数和语义互信息的特例。因为最大语义信息准则和最大似然准则以及正则化最小误差平方准则兼容，并且隶属函数比似然函数迁移性更好，比反概率函数更容易构造，隶属函数有希望被广泛用于机器学习。

视图映射和循环一致性生成的不完整多视图聚类

王英博, 郭凯雪 — 2025年03月05 00:00

传统聚类假设每个视图都完整，没有考虑数据损坏、设备故障导致的不完整视图情况。针对此问题，已有方法大多基于核和非负矩阵分解提出，没有明确补偿每个视图丢失的数据，学习的潜在表示也没有考虑聚类任务。为此设计视图映射和循环一致性生成的不完整多视图聚类(incomplete multi-view clustering generated by view mapping and cyclic consistency, MG_IMC)，利用已有数据信息得到各视图的风格编码和共享潜在表示，并通过生成对抗网络生成缺失的数据，在完整数据集上利用加权自适应融合捕获更好的通用结构，并在深度嵌入聚类层完成聚类任务。使用KL散度(Kullback-Leibler divergence)联合训练模型，学习的公共表示有助于生成缺失的数据，而补全的数据进一步生成聚类友好的公共表示。实验表明，相比已有方法，该算法得到更好的聚类效果。

一种基于KNN和随机仿射的边界样本合成过采样方法

冷强奎, 孙薛梓, 孟祥福 — 2025年03月05 00:00

过采样是处理不平衡数据分类问题的有效策略。本文提出了一种基于K近邻(K-nearest neighbor, KNN)和随机仿射的边界样本合成过采样方法，用于改进现有过采样方法的种子样本选择阶段和合成样本生成阶段。首先，引入三近邻理论，建立样本间有效的内在近邻关系，并去除数据集中的噪声，以降低后续分类器的过拟合风险。其次，准确识别那些难以学习且包含丰富信息的少数类边界样本，并将其用作采样种子。最后，利用局部随机仿射代替线性插值机制，在原始数据的近似流形中均匀地生成合成样本。相比于传统过采样方法，本文方法能更充分挖掘数据集中的重要边界信息，从而为分类器提供更多辅助以改善其分类性能。在18个基准数据集上，与8种经典采样方法(结合4种不同分类器)进行了大量对比实验。结果表明，本文所提方法获得了更高的F₁分数和几何均值(G-mean)，可以更为有效地解决不平衡数据分类问题。此外，统计分析也证实该方法具有更高的弗里德曼排名(Friedman ranking)。

基于深度强化学习的电力线与无线双模通信MAC层接入算法

2025年03月05 00:00

针对无线和电力线通信混合组网的信道竞争接入问题，提出了一种基于深度强化学习的电力线与无线双模通信的MAC接入算法。双模节点根据网络广播信息和信道使用等数据自适应接入双媒质信道。首先建立了基于双模通信网络交互和统计信息的双模通信节点数据采集模型；接着定义了基于协作信息的深度强化学习(deep reinforcement learning, DRL)状态空间、动作空间和奖励，设计了联合α-公平效用函数和P坚持接入机制的节点决策流程，实现基于双深度Q网络(double deep Q-network, DDQN)的双模节点自适应接入算法；最后进行算法性能仿真和对比分析。仿真结果表明，提出的接入算法能够在保证双模网络和信道接入公平性的条件下，有效提高双模通信节点的接入性能。

面向业务过程协同的隐私数据通信方法

2025年03月05 00:00

将区块链应用于业务过程协同可以增强业务过程协同的可信性，但是现有的数据通信方式存在影响数据可靠性和区块链可追溯性、泄露数据隐私等问题，无法满足组织间正常业务过程协同的需求。为解决上述问题，提出了一种面向业务过程协同的隐私数据通信方法，拓展了Wf-XML 2.0协议，并基于星际文件系统(inter planetary file system，IPFS)和非对称加密技术设计了代理组件Broker，将数据通信分为保存数据、请求数据和响应数据3个步骤执行来保障业务数据的隐私。通过Dolev-Yao攻击者模型、过程协同实际案例和实验对方法进行分析，验证了该方法的安全性、合理性和可行性。

改进滑动粗粒化和集成波动色散熵的故障诊断方法

2025年03月05 00:00

在多尺度波动色散熵中，多尺度粗粒化会忽略重构子序列部分相邻点之间的信息，并且子序列长度随着尺度因子的增大长度减小，这种特征提取的方法不利于故障分类。为了解决这个问题，本文提出了一种n次滑动粗粒化的方法，在确定的比例因子下，利用n次滑动方法保留了每点之间的信息，保证重构后的序列与重构前的序列长度一致。针对波动色散熵中映射技术过于单一的问题，本文利用集成波动色散熵对重构后的序列进行特征提取，使得熵计算更加准确。用西储大学等轴承数据集对算法进行了验证，所提方法的故障诊断精确度显著提高。

基于ODE扩散模型的多类异常检测和定位

2025年03月05 00:00

多类异常检测和定位旨在训练一个单一模型，在多类场景下该模型能够识别出偏离正常的异常区域。最近基于扩散模型的方法在该项任务中表现出色而开始受到关注，然而，现有方法侧重于改进扩散模型去噪网络，通过添加更多约束，保持多步生成的高一致性，实现更高的重构性能，但更多的采样步数也意味着更高的计算开销。为此，本文提出了一种基于常微分方程(ordinary differential equations, ODE)扩散模型的多类异常检测和定位方法，只需一步即可实现高质量的重构生成，同时引入时间步感知网络来缓解采样步数少可能导致的一致性和恒等捷径问题，从而进一步提高重构质量。在通用的基准数据集MVTec-AD上进行的实验结果表明，本文方法在精度上可与当前最先进方法相媲美，但是计算量更低速度更快，满足了工业异常检测和定位的高精度和实时性需求。

基于ECA-TCN的数据中心磁盘故障预测

2025年03月05 00:00

随着数据中心规模的不断扩大，磁盘故障对数据中心的运行稳定性产生越来越大的影响。当前预测方法在面对大规模、高维度和长序列的磁盘运行数据时仍存在不足。本文提出了一种高效通道注意力时间卷积网络(efficient channel attention-temporal convolutional network, ECA-TCN)模型，通过结合传统卷积神经网络一维卷积的优势，融入扩张卷积和残差结构，并引入注意力机制，该模型能够提高磁盘故障预测的准确性和稳定性。在实验中，将ECA-TCN模型与其他经典深度学习方法进行了比较，实验结果表明，ECA-TCN模型在磁盘故障预测任务上具有较高的准确性和稳定性。

基于Transformer模型的自闭症功能磁共振图像分类

2025年03月05 00:00

目前自闭症功能磁共振(functional magnetic resonance imaging, fMRI)图像分类模型在跨多个机构的数据集下分类精度较低，难以应用到自闭症的诊断工作中。为此，本文提出了一种基于Transformer的自闭症分类模型(autism spectrum disorder classification model based on Transformer, TransASD)。首先采用脑图谱模板提取fMRI数据中的时间序列输入Transformer模型，并引入一种重叠窗口注意力机制，能够更好地捕捉异构数据的局部与全局特征。其次，提出了一个跨窗口正则化方法作为额外的损失项，使模型可以更加准确地聚焦于重要的特征。本文使用该模型在公开的自闭症数据集ABIDE上进行实验，在10折交叉验证法下得到了71.44%的准确率，该模型对比其他先进算法模型取得了更好的分类效果。

面向下肢外骨骼的运动意图识别算法研究

2025年03月05 00:00

随着人工智能和传感技术的快速发展，下肢外骨骼技术在助力行走和运动辅助领域展现出巨大的潜力，利用表面肌电(surface myoelectricity, sEMG)信号解码人体运动意图对实现人机运动的协调统一至关重要。然而，由于sEMG信号具有时空差异和非线性动态的特点，导致现有方法存在特征捕捉单一、识别准确率低等不足。针对上述问题，提出一种基于多尺度卷积神经网络的运动意图感知模型。该模型采用多个差异卷积块提取sEMG信号的时间与空间尺度特征，并利用多层深度网络捕捉sEMG信号的非线性动态特征。该模型针对离线肌电数据库的识别准确率达到94%，其中对全脚离地运动类别的识别准确率高达98%。在人体穿戴下肢外骨骼进行在线运动意图识别实验中，该模型的平均识别准确率超过90%，验证了其在下肢外骨骼意图识别领域的有效性。

基于强化学习与直接升力的舰载机自动着舰控制

王子博, 朱齐丹, 孔令鑫, 王立鹏 — 2025年03月05 00:00

舰载机着舰过程是舰载机作业事故率最高的阶段，为实现舰载机高精度全自动着舰，提出了一种新的舰载机自动着舰控制方法，设计了基于直接升力的控制器与基于强化学习的纵向制导律。直接升力控制实现舰载机飞行状态之间的解耦，增强舰载机姿态角与气流角的稳定性。制导律通过深度强化学习算法训练的神经网络非线性拟合得到，提高了扰动情况下舰载机对理想下滑道的跟踪精度，同时避免了传统方法繁杂的参数整定工作以及对模型的依赖。通过对比仿真结果，在舰尾流扰动下，相比于滑模控制方法、预设性能控制方法、PID控制方法与基于径向基神经网络的自适应控制方法，本文方法具有更好的鲁棒性，增强了对舰尾流扰动的抑制能力，提高了着舰精度。

洋流干扰下低速欠驱动AUV的三维路径规划

陈世同, 鲁子瑜 — 2025年03月05 00:00

海洋洋流对低速欠驱动水下运载器(automatic underwater vehicle, AUV)的航行影响巨大，会增加航行时间、增大能源消耗以及改变航行轨迹，故在洋流干扰的情况下规划出一条最优航行路线有着重要的意义。本文主要分析了洋流对AUV的影响机理，由于传统的强化Q网络(deep Q-network, DQN)路径规划算法在复杂环境下存在过估计的问题，提出了基于优先经验回放方法的改进DQN路径规划算法，同时对动作设计和奖励函数进行优化。在基于S57海图数据建立的三维海洋环境下，利用地球与空间研究机构(earth & space research, ESR)提供的洋流数据进行路径规划仿真。实验结果表明，在充分考虑洋流干扰的情况下，改进后的DQN算法能够规划出较优的全局路径规划，提供一条时间最短且能耗最低的航行路线，为AUV水下航行提供参考。

图像信息输入下的软线重构与抓取验证

2025年03月05 00:00

针对使用机器人对柔性物体进行操作的复杂任务，设计了一种简洁高效的软线抓取方法。首先利用双目相机和图像处理方法对软线进行测量，结合坐标系间的转换关系，从图像中还原了其特征点的空间坐标信息；采用Frenet标架对软线进行了建模重构，以获取软线上任意点的位置与弯曲方向信息；提出了六自由度机械臂的位姿表示及转换方法以及相机的标定流程，将曲线任意弧长处的坐标值和Frenet标架方向转换为夹爪末端的位姿参数，最后开展了目标点处沿软线弯曲方向抓取软线的地面实验，验证了方法的有效性。

未知混动态环境下多无人机轨迹规划

胡克, 孙洪飞 — 2025年03月05 00:00

实现多无人机在野外未知混动态环境下的快速在线重规划具有较大挑战。本文提出一种分布式的动力学规划方案，用于自主无人机集群在具有静态障碍和动态障碍的混动态环境中快速重规划动态可行轨迹。首先，提出一种改进的动力学路径搜索方法，利用最优相互避碰算法弥补动力学路径搜索难以处理动态障碍和搜索效率低下的不足，获取一条安全的参考路径。然后，根据参考路径拟合出一条初始轨迹并通过基于梯度的优化方法进行优化。为提高优化效率，提出了一种适配动力学规划方案的避障梯度构建方法，它充分利用已知信息快速构建避障梯度，使得轨迹优化可以在几毫秒以内完成。最后，通过与其他规划方案相比较，验证了本方案的可行性与快速性。

基元潜部特征元挖掘的智能方法研究

张丽芳, 李兴森 — 2025年03月05 00:00

潜部特征元构建是可拓学基元理论的重要研究内容，潜在信息挖掘对解决问题和激发创新思维至关重要。为了解决目前人工识别基元潜部特征元效率低、覆盖面窄和数量不足的问题，研究基元潜部特征元显化理论与人工智能算法实现的结合点，提出挖掘基元潜部特征元的流程化、系统性方法，使用爬虫技术收集目标基元对象的相关信息，清洗噪音数据并从句子中挖掘构成特征元的名称和描述，用概率统计的定量方法筛选潜部特征元并通过Python代码实现智能挖掘功能，最后通过案例对比分析进行论证。研究结果能有效提高基元潜部特征元的识别效率和智能化水平，对从复杂多变的语料句法中进行语义概括也有一定的参考作用，为进一步提高特征名称及其量值智能提取的精确性积累训练集，促进可拓展型人工智能理论的发展。

用于高维小样本特征选择的超网络设计

魏俊伊, 董红斌, 余紫康 — 2025年03月05 00:00

特征选择是受各行业广泛关注的问题。特征选择针对的数据集通常是高维的，且样本数较少，例如生物、医学领域的数据集。虽然很多的正则化网络在这种数据集上的表现能够优于复杂的网络，但是在小数据量上许多潜在的特征关系仍然会被过度挖掘，从而出现过拟合的情况。为了解决此类问题，提出了端到端的稀疏重构网络，模型先对特征进行稀有增强和奇异值嵌入，之后通过并行辅助网络对嵌入矩阵进行训练，重构预测权重，实现了削减参数的超网络学习方式。参数较少的网络受过拟合的影响也会随之减少，有效降低了无效参数对网络的影响。对生物、医学领域的12种高维小样本数据集进行了实验，并通过对比实验发现在8种特征选择网络中降维后，本网络的分类准确率平均提升了3.26百分点。另外，通过消融实验分别证明了分解层、重构层、关联层的作用，最后分析权重结果，进一步阐述了模型的扩展应用。

基于多色域特征与物理模型的水下图像增强

张瑞航, 林森 — 2025年03月05 00:00

水下智能机器人在探测海洋信息时易受悬浮颗粒和光衰减现象的干扰，导致视觉图像退化，造成色彩扭曲、细节模糊等现象。针对上述问题，提出基于多色域特征与物理模型的水下图像增强。首先，设计多色域特征聚合网络，旨在利用不同色域空间提供的信息帮助图像颜色恢复。其次，为获取到更真实的视觉效果，对白平衡算法进行推广，并将深度学习算法与水下光学成像模型结合，以数据驱动的方式求解清晰图像。最后，提出多色域轮换模式对网络进行训练，在不同色域空间中搜索最优解。实验证明，该方法在色彩平衡、细节恢复方面效果显著，相比经典算法与前沿算法更具优势，在特征点匹配与显著性检验任务中满足水下智能机器人视觉系统对图像清晰度的要求。

低光照环境下基于定制椭圆的无人船姿态视觉测量

2025年03月05 00:00

针对低光照条件下图像对比度低和噪声增多导致单目视觉姿态测量不准确的问题，提出基于快速椭圆检测的无人船姿态估计方法。首先，通过自适应颜色阈值分割技术与颜色和对比度增强技术相结合来提升边缘信息的获取精确度。其次，设计八邻域跟踪与弧弦比方法去除低光照图像噪声引起的伪弧，并结合改进的圆弧特征映射技术进一步区分伪弧段，以减少参数拟合的计算负担。最后，利用椭圆平面法向量和矩形法向量的平行性消除椭圆姿态角计算的二义性，以提高算法在低光照环境下的鲁棒性。实验表明，提出的无人船姿态估计算法具有更快的检测速度，同时保持更高的估计精度。

一种基于灰色理论和弱缓冲算子的装备备件预测方法

齐小刚, 姚兆冬 — 2025年03月05 00:00

备件不足或者冗余是维修保障中的经典问题，严重影响维修效率。如何进行准确、有效的备件预测已成为维修保障的关键问题，由于备件预测的短期性和无规律性，灰色预测成为了常用的方法，但目前的灰色预测还存在精度不足的问题。为提升精度，从光滑化原始序列和模型改进2个方面对灰色预测进行改进，选取了4种不同的模型和3种光滑函数，并进一步构建新的弱缓冲算子来减少因累计计算产生的误差。实验结果表明在不同模型和光滑函数下，构建的算子对精度的提升是可行的，改进效果明显，同模型改进和光滑化结合可以获得更为准确的结果。

面向配电网典型部件的热故障精准判别方法

2025年03月05 00:00

提出一种配电网部件的热故障判别方法。首先包括一种检测任务转换方法，作为热故障判别前置任务的目标检测中。方法主要实现了将可见光图像和红外图像2种不同模态的信息进行巧妙地融合。其次是一种风格迁移方法，用于巡检任务中的场景自适应。最后是一种改进的交并集损失，用于降低低质量标注示例对边界框回归的影响，以提高模型检测性能。所提出方法较此前方法相比采用了多模态图像的信息，不局限于低分辨率红外图像。且改进后的方法使部件检测(定位)平均精度达到了88.1%，且不影响实时性，误检漏检情况也大大减少。优越的目标检测性能为热故障判别提供了良好的前提条件，温度解译平均误差不超过0.8 ℃。

基于自适应图学习权重的多模态情感分析

曲海成, 徐波 — 2025年03月05 00:00

在多模态情感分析任务中，由于不同模态表现方式的不一致性，模态间的情感信息密度具有较大的差异。为了平衡情感信息在不同模态中分布的不均匀性并减少多模态特征表示的冗余性，提出了一种基于自适应图学习权重的多模态情感分析方法。首先，采用不同的特征提取方法捕获单一模态内的特定信息；其次，将不同模态通过公共编码器映射到同一空间中，利用跨模态注意力机制来显式构建模态间的关联；然后，将每种模态对任务分类的预测值以及模态表示嵌入到自适应图中，通过模态标签学习不同模态对最终分类任务的贡献度来动态调整不同模态之间的权重，以适应主导模态的变化；最后，引入信息瓶颈机制进行去噪，旨在学习一种无冗余的多模态特征表示进行情感预测。在公开的多模态情感分析数据集上对所提出的模型进行了评估。实验结果表明，其有效提升了多模态情感分析的准确性。