智能系统学报 /oa 因素表示的信息空间与广义概率逻辑 /oa/darticle.aspx?type=view&id=201810021 国内外近年来所提出的广义概率逻辑对于人工智能的发展有重要意义。能否反映变换演化的实际场景,使逻辑判断能够灵活变通,这是广义概率逻辑发展的关键。为了解决这一问题,本文的目是以信息空间作为逻辑与实际场景的接口。有了这个接口,逻辑判断就能反映变幻莫测的实际场景。本文的方法是用因素空间来定义表现论域以形成新的信息空间,将谓词中的变元取为因素,在已有的逻辑系统中加上本文所提出的背景公理,所有的推理都是在一定背景之下的推理,不同的背景会推出不同的结论。结果是新的逻辑既能维系Stone表示定理的表现要求,又能变得更加灵活有效。结论能使广义概率逻辑更有效地服务于人工智能。为了配合机制主义人工智能的需要,本文还特别提出了语法-语用对接的方法和目标驱动的逆向推理设想,最后为泛逻辑的3种连续算子对进行了数学证明。 2019年09月05 00:00 2019年05期 843 852 4248448 汪培庄<sup>1</sup>, 周红军<sup>2</sup>, 何华灿<sup>3</sup>, 钟义信<sup>4</sup> 空间故障树与因素空间融合的智能可靠性分析方法 /oa/darticle.aspx?type=view&id=201807022 现有系统可靠性分析方法一般具有针对性,缺乏广泛的适应性和扩展性。由于智能科学、信息科学和大数据技术的涌现和发展,使得传统可靠性分析技术难以适应新的需要。因此作者提出了空间故障树理论,目的是分析多因素影响下的系统可靠性变化特征。将空间故障树理论与因素空间理论、云模型、模糊数学及系统稳定性等相结合,使其具有智能分析和故障大数据处理能力,以满足未来技术环境下的分析要求。本文论述了空间故障树和因素空间的发展史及主要理论与功能;以及两种理论结合,描述和分析系统演化过程的可行性。研究表明,空间故障树理论具有良好的扩展性和适应性,可适应未来技术环境,也可作为系统演化过程分析的普适框架。 2019年09月05 00:00 2019年05期 853 864 2864943 崔铁军<sup>1,2</sup>, 汪培庄<sup>3</sup> 偏联系数的计算与应用研究 /oa/darticle.aspx?type=view&id=201810022 偏联系数是联系数的一种伴随函数,其计算过程反映出联系数的联系分量在各个微观层次上的“矛盾运动”,计算结果指示出这种“矛盾运动”的阶段性结果,是“系统宏观状态与微观趋势多层分析法”的主要数学工具。本文系统阐述常用的二元至五元联系数的偏联系数算法和若干新思路,并从智能技术创新和信息能开发利用等角度指出偏联系数算法是一种新的智能算法。 2019年09月05 00:00 2019年05期 865 876 2942848 杨红梅<sup>1</sup>, 赵克勤<sup>2</sup> 一种恢复图像自然色彩的重构方法 /oa/darticle.aspx?type=view&id=201805011 现代数码相机是通过颜色过滤矩阵在每个像素位置采集一个颜色分量,重构出全彩色数字图像。压缩感知理论证明了该重构是误差有界的,但在实际应用时却隐含着一个问题:重构图像所需的稀疏编码字典是从图像数据库学习出来的,而目前数字图像都是重构出来的,因此存在着从重构的图像学习字典去重构图像的循环悖论。针对这个问题,提出并构建了新的完全采样彩色图像的Sandwich图像数据集,打破了压缩感知理论在应用于图像重构时的循环悖论,使得压缩感知方法能够真正地重建自然彩色图像。Sandwich图像数据集的构建及其训练得到的字典可以应用于如图像超分辨率重构、去噪、修复等领域。深入的图像重建实验表明,使用sandwich图像集训练的字典不论是字典原子特性还是由其重构得到的图像质量均好于基于传统数据集的结果。 2019年09月05 00:00 2019年05期 877 881 4072696 陶霖密, 袁春, 王浩达 面向自闭症辅助诊断的无监督模糊特征学习新方法 /oa/darticle.aspx?type=view&id=201808005 自闭症患者的行为和认知缺陷与潜在的脑功能异常有关。对于静息态功能磁振图像(functional magnetic resonance imaging, fMRI)高维特征,传统的线性特征提取方法不能充分提取其中的有效信息用于分类。为此,本文面向fMRI数据提出一种新型的无监督模糊特征映射方法,并将其与多视角支持向量机相结合,构建分类模型应用于自闭症的计算机辅助诊断。该方法首先采用多输出TSK模糊系统的规则前件学习方法,将原始特征数据映射到线性可分的高维空间;然后引入流形正则化学习框架,提出新型的无监督模糊特征学习方法,从而得到原输出特征向量的非线性低维嵌入表示;最后使用多视角SVM算法进行分类。实验结果表明:本文方法能够有效提取静息态fMRI数据中的重要特征,在保证模型具有优越且稳定的分类性能的前提下,还可以提高模型的可解释性。 2019年09月05 00:00 2019年05期 882 888 4366450 张英, 王骏, 鲍国强, 张春香, 王士同 网络拓扑特征的不平衡数据分类 /oa/darticle.aspx?type=view&id=201812014 现实中的数据集普遍具有非均衡性。针对不平衡分类问题,建立数据集网络结构来充分挖掘隐藏在样本点位置信息外的拓扑特征,分析网络节点的连接特性并赋予节点不同的效率。计算待测节点与每个子网络的相似性测度,依据新型的概率模型,进一步推算出该节点与各子网络的整体性测度。构建了一种基于网络拓扑特征的不平衡数据分类方法,算法中引入不平衡因子<i>c</i>用以减小由正负类样本数量差异所带来的影响。实验结果表明,该算法能有效提高分类精度,特别是对拓扑特征明显的数据集,在分类性能和适应能力上相比传统分类方法都得到进一步提升。 2019年09月05 00:00 2019年05期 889 896 4374470 普事业, 刘三阳, 白艺光 公理化模糊共享近邻自适应谱聚类算法 /oa/darticle.aspx?type=view&id=201810002 针对传统的谱聚类算法通常利用高斯核函数作为相似性度量,且单纯以距离决定相似性不能充分表现原始数据中固有的模糊性、不确定性和复杂性,导致聚类性能降低的问题。提出了一种公理化模糊共享近邻自适应谱聚类算法,首先结合公理化模糊集理论提出了一种模糊相似性度量方法,利用识别特征来衡量更合适的数据成对相似性,然后采用共享近邻的方法发现密集区域样本点分布的结构和密度信息,并且根据每个点所处领域的稠密程度自动调节参数<i>σ</i>,从而生成更强大的亲和矩阵,进一步提高聚类准确率。实验表明,相较于距离谱聚类、自适应谱聚类、模糊聚类方法和地标点谱聚类,所提算法有着更好的聚类性能。 2019年09月05 00:00 2019年05期 897 904 2881992 储德润, 周治平 一种基于模糊划分和模糊加权的集成深度信念网络 /oa/darticle.aspx?type=view&id=201809018 针对DBN算法训练时间复杂度高,容易过拟合等问题,受模糊理论启发,提出了一种基于模糊划分和模糊加权的集成深度信念网络,即FE-DBN(ensemble deep belief network with fuzzy partition and fuzzy weighting),用于处理大样本数据的分类问题。通过模糊聚类算法FCM将训练数据划分为多个子集,在各个子集上并行训练不同结构的DBN,将每个分类器的结果进行模糊加权。在人工数据集、UCI数据集上的实验结果表明,提出的FE-DBN比DBN精度均有所提升,具有更快的运行时间。 2019年09月05 00:00 2019年05期 905 914 4677988 张雄涛<sup>1,2</sup>, 胡文军<sup>2</sup>, 王士同<sup>1</sup> 可拓聚类的科教人际网络节点重要性动态分析方法 /oa/darticle.aspx?type=view&id=201811012 目前大多数研究对复杂社会网络关键节点影响力的识别都是静态的,缺乏动态变化的分析。采用可拓聚类方法对动态变化下的科教人际网络进行量化分析,首先以多属性决策法计算每个节点重要性,再利用变异系数权重法计算得该节点综合重要性量值,之后划分等级并取标准正域和正域区间,利用可拓关联函数计算每个节点与每个等级的关联度,关联度值最大的等级即为该节点对应等级,最后分析同一社会网络节点在不同时间点的重要性等级变化。可拓聚类方法尝试从动态上对网络节点重要性进行把握,最后通过实例验证了该方法的有效性。 2019年09月05 00:00 2019年05期 915 921 3870137 严家萌<sup>1,2</sup>, 许立波<sup>2</sup>, 李兴森<sup>3</sup>, 庞超逸<sup>2</sup>, 董瑞辰<sup>4</sup> 基于改进的稀疏表示和PCNN的图像融合算法研究 /oa/darticle.aspx?type=view&id=201805045 为提高图像融合的清晰度,本文提出一种基于改进的稀疏表示和脉冲耦合神经网络(pulse coupled neural network,PCNN)的图像融合。利用非下采样剪切波变换(non-subsampled shearlet transform,NSST)对源图像进行分解变换,得到相应的低频子带和高频子带具有不同的信息。对于低频子带,采用改进的稀疏表示进行融合,利用<i>K</i>奇异值分解(<i>K</i>-singular value decomposition,<i>K</i>-SVD)算法,并对源图像进行自适应学习的多个子字典构造成联合词典。对于高频子带,则改进PCNN融合系数的选择方法,利用改进的空间频率作为神经元反馈输入来激励PCNN模型,并根据点火输出的总幅度最大的融合规则选择高频系数。最后,将融合后的低频子带和高频子带系数进行NSST逆变换,重构出融合图像。实验结果表明:该算法很好地保留了图像的边缘信息,并且得到的图像在相关的客观评价标准上也取得了良好的效果,表明了本算法的有效性。 2019年09月05 00:00 2019年05期 922 928 1256227 王建, 吴锡生 代价敏感数据的多标记特征选择算法 /oa/darticle.aspx?type=view&id=201807027 在多标记学习中,特征选择是提升多标记学习分类性能的有效手段。针对多标记特征选择算法计算复杂度较大且未考虑到现实应用中数据的获取往往需要花费代价,本文提出了一种面向代价敏感数据的多标记特征选择算法。该算法利用信息熵分析特征与标记之间的相关性,重新定义了一种基于测试代价的特征重要度准则,并根据服从正态分布的特征重要度和特征代价的标准差,给出一种合理的阈值选择方法,同时通过阈值剔除冗余和不相关特征,得到低总代价的特征子集。通过在多标记数据的实验对比和分析,表明该方法的有效性和可行性。 2019年09月05 00:00 2019年05期 929 938 4403601 黄琴<sup>1,2</sup>, 钱文彬<sup>1,2</sup>, 王映龙<sup>1</sup>, 吴兵龙<sup>2</sup> 模糊直方图模型的运动目标跟踪 /oa/darticle.aspx?type=view&id=201807033 为改善跟踪系统对跟踪场景中目标色度和光照变化鲁棒性,提出基于模糊直方图的目标模型建立方法。首先,在色度论域内定义色度模糊等级,根据模糊隶属度函数建立目标区域模糊直方图,由此降低目标直方图模型对色度等级阈值的敏感性。然后,利用模糊直方图模型进行反向投影,建立跟踪场景的概率分布图。最后,利用Camshift方法实现目标的识别、定位与跟踪。仿真实验结果表明:与传统方法相比,采用模糊直方图模型的跟踪方法对色度漂移等干扰具有更好的适应性,目标在顺光、侧光以及逆光环境下移动时,该方法能够完成目标的准确定位与跟踪,单帧平均跟踪时间与基本Camshift方法相当,单帧最大跟踪时间小于40 ms,满足电视跟踪等系统实时性要求。 2019年09月05 00:00 2019年05期 939 946 2323744 修春波<sup>1,2</sup>, 李欣<sup>1</sup>, 巴富珊<sup>1</sup> 缺失数据的混合式重建方法 /oa/darticle.aspx?type=view&id=201807037 缺失数据的问题在各领域中是不可避免的,而传统的数据挖掘算法在处理不完整的数据集时表现不佳。本文将协方差矩阵及协方差矩阵的行列式应用于粒子群优化算法的适应度函数中,并以迭代的方式得出最佳阈值,再使用最佳阈值进行基于进化聚类算法的缺失值重建,解决了阈值的选取困难及其对数据重建结果的影响问题。然后,在自联想极限学习机中调用具有最佳阈值的进化聚类算法,解决了自联想极限学习机输入权值选择的随机性。最后,选取6个UCI标准数据集及9个激活函数来进行验证。实验结果表明,相对于现有的大多数数据重建方法,所提的混合式重建方法可以更有效地完成缺失数据的重建。 2019年09月05 00:00 2019年05期 947 952 983882 于本成<sup>1,2</sup>, 丁世飞<sup>1</sup> 应用于不平衡多分类问题的损失平衡函数 /oa/darticle.aspx?type=view&id=201808004 传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在小批量内样本损失自适应均衡化的方法。该算法采用了一种动态学习损失函数的方式,根据小批量内样本标签信息调整各样本损失权重,从而实现在小批量内各类别样本总损失的平衡性。通过在caltech101和ILSVRC2014数据集上的实验表明,该算法能够有效地减少计算成本并提高分类精度,且一定程度上避免了过采样方法所带来的模型过拟合风险。 2019年09月05 00:00 2019年05期 953 958 4030991 黄庆康, 宋恺涛, 陆建峰 面向局部线性回归分类器的判别分析方法 /oa/darticle.aspx?type=view&id=201808007 局部线性回归分类器(locality-regularized linear regression classification,LLRC)在人脸识别上表现出了高识别率以及高效性的特点,然而原始特征空间并不能保证LLRC的效率。为了提高LLRC的性能,提出了一种与LLRC相联系的新的降维方法,即面向局部线性回归分类器的判别分析方法(locality-regularized linear regression classification based discriminant analysis,LLRC-DA)。LLRC-DA根据LLRC的决策准则设计目标函数,通过最大化类间局部重构误差并最小化类内局部重构误差来寻找最优的特征子空间。此外,LLRC-DA通过对投影矩阵添加正交约束来消除冗余信息。为了有效地求解投影矩阵,利用优化变量之间的关系,提出了一种新的迹比优化算法。因此LLRC-DA非常适用于LLRC。在FERET和ORL人脸库上进行了实验,实验结果表明LLRC-DA比现有方法更具有优越性。 2019年09月05 00:00 2019年05期 959 965 4434455 朱换荣, 郑智超, 孙怀江 结合谱聚类的标记分布学习 /oa/darticle.aspx?type=view&id=201809019 标记分布是一种新的学习范式,现有算法大多数直接使用条件概率建立参数模型,未充分考虑样本之间的相关性,导致计算复杂度增大。基于此,引入谱聚类算法,通过样本之间相似性关系将聚类问题转化为图的全局最优划分问题,进而提出一种结合谱聚类的标记分布学习算法(label distribution learning with spectral clustering,SC-LDL)。首先,计算样本相似度矩阵;然后,对矩阵进行拉普拉斯变换,构造特征向量空间;最后,通过K-means算法对数据进行聚类建立参数模型,预测未知样本的标记分布。与现有算法在多个数据集上的实验表明,本算法优于多个对比算法,统计假设检验进一步说明算法的有效性和优越性。 2019年09月05 00:00 2019年05期 966 973 947119 王一宾<sup>1,2</sup>, 李田力<sup>1</sup>, 程玉胜<sup>1,2</sup> 基于竞争性协同表示的局部判别投影特征提取 /oa/darticle.aspx?type=view&id=201809020 特征提取算法中利用样本间的协同表示关系构造邻接图只考虑所有训练样本的协同能力,而忽视了每一类训练样本的内在竞争能力。为此,本文提出一种基于竞争性协同表示的局部判别投影特征提取算法(competitive collaborative repesentation-based local discrininant projection for feature extraction,CCRLDP),该算法利用基于具有竞争性协同表示的方法构造类间图和类内图,考虑到邻接图中各类型系数的影响,引入保留正表示系数的思想稀疏化邻接图,通过计算类内散度矩阵和类间散度矩阵来刻画图像的局部结构并得其最优投影矩阵。在一些数据集上的实验结果表明,相比同类基于局部判别投影的特征提取算法,该算法具有很高的识别率,并在噪声和遮挡上具有良好的鲁棒性,该算法能有效地提高图像的识别效率。 2019年09月05 00:00 2019年05期 974 981 944762 李静, 陈秀宏 利用MISA多目标优化的置信规则库分类算法 /oa/darticle.aspx?type=view&id=201809022 现有基于置信规则库的分类系统的分类准确率和效率受到系统参数设置以及规则库结构合理性的影响。为了寻找到最佳的参数值和最优的规则库结构,本文结合多目标免疫系统算法(multiobjective immune system algorithm, MISA)提出利用MISA多目标优化的置信规则库分类算法。该方法融合特征属性约简思想和差分进化算法思想建立训练模型,采用多目标免疫系统算法对系统复杂度和分类准确率进行多目标优化,从而寻找到分类模型的最优解。在实验分析中,首先将本文提出的置信规则库多目标分类系统MISA-BRM和置信规则库分类系统的实验结果进行对比,从复杂度和准确率两个维度说明本文方法的有效性。同时还将本文方法与现有的其他分类方法进行比较,验证本文方法的可行性和有效性。实验结果表明,本文方法能够有效地对基于置信规则库的分类系统的准确率和复杂度进行多目标优化。 2019年09月05 00:00 2019年05期 982 990 4487117 林锦, 胡家琛, 刘莞玲, 吴英杰 分布式事件触发多自主体领导跟随一致性研究 /oa/darticle.aspx?type=view&id=201809035 为了提高系统的通信效率和能源利用率,减少多自主体系统硬件资源的浪费,提出了只需要自主体自身及其最近邻居节点信息的分布式事件触发控制算法。研究了带有动态领导者的二阶多自主体系统领导跟随一致性问题。应用矩阵论和现代控制理论研究了在分布式事件触发机制下的二阶系统,得到了基于事件触发机制的多自主体系统协同运动的收敛条件。通过理论分析与计算表明,在此控制协议下不会存在芝诺行为,并且多自主体系统可以实现领导跟随一致性。最后,应用计算机仿真验证了本文所提控制协议的可靠性。 2019年09月05 00:00 2019年05期 991 997 5701599 刘远山<sup>1</sup>, 杨洪勇<sup>1</sup>, 李玉玲<sup>1</sup>, 刘凡<sup>1</sup>, 杨怡泽<sup>2</sup> 基于自然邻居邻域图的无参数离群检测算法 /oa/darticle.aspx?type=view&id=201809032 数据挖掘领域,基于最近邻居思想的离群检测算法在面对复杂数据时,很难在没有足够先验知识条件下进行适当的参数选择。为了解决这个问题,本文在自然邻居方法的基础上,提出一种利用加权自然邻居邻域图进行离群检测的算法。该算法在整个过程不需要人为设置参数,并且能在不同分布特征的数据中准确找到数据集中的全局离群点和局部离群点。人工数据集和真实数据的离群检测结果均证明,本算法能够取得和有参数的算法中最优参数相近的效果,算法检测结果远好于对参数敏感算法的大部分情况,且更优于对参数不敏感的算法,具有更强的普适性和实用性。 2019年09月05 00:00 2019年05期 998 1006 8583816 冯骥, 冉瑞生, 魏延 局部自适应输入控制的随机游走抠图 /oa/darticle.aspx?type=view&id=201809014 针对传统性抠图算法中,非完全正确用户标注及不精确超像素分割造成的信息误扩散,以随机游走算法为基础,提出带软性约束的抠图算法。通过对扩展Dirichlet问题的推导,指出带软约束的随机游走与部分自吸收随机游走概率的关联性。以吸收概率为指导,在传统相似扩散所构建的图模型上,根据局部窗口内特征矩阵的秩与方差设计了输入控制矩阵,使得信息扩散的过程能够跟随图像的局部特征进行自适应扩散。最后将软约束随机游走应用到单帧双层抠图及视频抠图中。实验表明,所提算法具有信息远距传播能力和良好的容错性能,尤其在用户标注不够充分的情况下能够取得更加优良的抠图结果。 2019年09月05 00:00 2019年05期 1007 1016 1701821 陈秋凤<sup>1,2</sup>, 申群太<sup>2</sup> 基于Hadoop的大规模网络安全实体识别方法 /oa/darticle.aspx?type=view&id=201809024 随着大数据时代的到来,如何从多源异构数据中准确地识别网络安全实体是构建网络安全知识图谱的基础问题。因此本文针对网络安全相关文本数据,研究支持海量网络数据的安全实体识别算法,为构建网络安全知识图谱奠定基础。针对海量的文本类网络数据中安全实体的高效精准抽取问题,本文基于Hadoop分布式计算框架提出改进的条件随机场(conditional random fields,CRF)算法,对数据集进行有效分割,实现安全实体的高效准确识别。在大规模真实网络数据集上的实验证明,本文提出的算法达到了较高的网络安全实体识别准确率,同时提高了识别的效率。 2019年09月05 00:00 2019年05期 1017 1025 1394233 秦娅<sup>1,2</sup>, 申国伟<sup>1,2</sup>, 余红星<sup>1,2</sup> 基于动态系统的机器人模仿学习方法研究 /oa/darticle.aspx?type=view&id=201807018 针对当前机器人模仿学习过程中,运动模仿存在无法收敛到目标点以及泛化能力差的问题,引入一种基于动态系统(dynamical system,DS)的模仿学习方法。该方法通过高斯混合模型(gaussian mixture model,GMM)将示教运动数据建模为一非线性动态系统;将DS全局稳定的充分条件作为约束,以保证DS所生成的所有轨迹收敛到目标点;将动态系统模型的参数学习问题转化为求解一个约束优化问题,从而得到模型参数。以7bot机械臂为实验对象,进行仿真实验和机器人实验,实验结果表明:该方法学习的DS模型从不同起点生成的所有轨迹都收敛到目标点,轨迹平滑,泛化能力好。 2019年09月05 00:00 2019年05期 1026 1034 5677648 于建均<sup>1,2</sup>, 姚红柯<sup>1,2</sup>, 左国玉<sup>1,2</sup>, 阮晓钢<sup>1,2</sup>, 安硕<sup>1,2</sup> 积累<i>N</i>次主动变换的传导知识挖掘 /oa/darticle.aspx?type=view&id=201804042 针对前<i>N</i>次可拓变换未引起与之相关的信息元发生传导变换,而<i>N</i>+1次主动变换才能引起与之相关的信息元发生传导变换的实际问题,运用可拓变换、传导效应等,并通过给出信息元某特征对于目标特征灵敏度的概念,深入挖掘此类可拓变换及其传导变换的传导知识。通过对某型导弹武器系统定型过程中的试验数据进行分析,表明该方法是对已有传导知识数据挖掘理论的完善和补充,使传导知识挖掘的理论更加丰富、全面。 2019年09月05 00:00 2019年05期 1035 1039 2985988 王丰, 顾佼佼, 林瑜 基于邻域系统的智能车辆最优轨迹规划方法 /oa/darticle.aspx?type=view&id=201805004 针对智能车在行驶中的轨迹规划与控制问题。以邻域系统理论为基础,将智能车在复杂道路的动态控制转化为邻域内的简单静态控制;对邻域内的最优轨迹曲线进行选取,采用曲率的积分定义了曲线的弯阻指数,并以此为基础给出了邻域内的最优轨迹曲线评判模型和求解算法;以插值方法所建立的满意轨迹曲线为例进行仿真。结果表明,该方法在选取智能车的行驶轨迹的平稳光滑性上有一定的优越性。 2019年09月05 00:00 2019年05期 1040 1047 4505652 王星, 赵海良, 王志刚 概念格在不完备形式背景中的知识获取模型 /oa/darticle.aspx?type=view&id=201809021 为了使概念格模型具有更强的数据处理能力,消除不完备信息带来的影响,针对经典概念格的局限性,本文将粗糙集中的粒化思维融入到概念格中。首先探讨了概念格视角下的信息粒化方法,然后提出了基于等价类和基于极大相容类的知识获取方法,最后给出了实例分析。这些方法一方面有助于概念格与粗糙集的融合,另一方面也为探索不完备形式背景的分析处理机制提供了有益思路。 2019年09月05 00:00 2019年05期 1048 1055 4376176 王雯<sup>1,2</sup>, 康向平<sup>3,4</sup>, 武燕<sup>2</sup> 引入外部词向量的文本信息网络表示学习 /oa/darticle.aspx?type=view&id=201809037 针对信息网络(text-based information network)现有研究多基于网络自身信息建模,受限于任务语料规模,只使用任务相关文本进行建模容易产生语义漂移或语义残缺的问题,本文将外部语料引入建模过程中,利用外部语料得到的词向量对建模过程进行优化,提出基于外部词向量的网络表示模型NE-EWV(network embedding based on external word vectors),从语义特征空间以及结构特征空间两个角度学习特征融合的网络表示。通过实验,在现实网络数据集中对模型有效性进行了验证。实验结果表明,在链接预测任务中的AUC指标,相比只考虑结构特征的模型提升7%~19%,相比考虑结构与文本特征的模型在大部分情况下有1%~12%提升;在节点分类任务中,与基线方法中性能最好的CANE性能相当。证明引入外部词向量作为外部知识能够有效提升网络表示能力。 2019年09月05 00:00 2019年05期 1056 1063 4181900 张潇鲲, 刘琰, 陈静