智能系统学报 /oa 基于用户意图理解的社交网络跨媒体搜索与挖掘 /oa/darticle.aspx?type=view&id=201706075 随着在线社交网络的盛行,网络用户不仅对信息资讯的获取速度和实时性提出了更高的要求,对个性化和精确化的搜索需求日益增长。为了提升搜索引擎的质量以及其结果列表的准确性,需要深层次地挖掘用户搜索意图。本文分析了用户搜索意图理解在线社交网络跨媒体进行精准搜索与挖掘的研究现状,包括知识图谱在线社交网络多模态信息感知、面向用户搜索意图匹配的跨媒体大数据深度语义学习方面的应用,以及用户搜索意图理解的在线社交网络精准搜索与挖掘的应用等。最后,对未来研究存在的问题和可能面临的挑战进行了展望。 2017年12月25 00:00 2017年06期 761 769 739541 崔婉秋, 杜军平, 周南, 梁美玉 行人重识别研究综述 /oa/darticle.aspx?type=view&id=201706084 行人重识别是智能视频分析领域的研究热点,得到了学术界的广泛重视。行人重识别旨在非重叠视角域多摄像头网络下进行的行人匹配,即确认不同位置的摄像头在不同的时刻拍摄到的行人目标是否为同一人。本文根据研究对象的不同,将目前的研究分为基于图像的行人重识别和基于视频的行人重识别两类,对这两类分别从特征描述、度量学习和数据库集3个方面将现有文献分类进行了详细地总结和分析。此外,随着近年来深度学习算法的广泛应用,也带来了行人重识别在特征描述和度量学习方面算法的变革,总结了深度学习在行人重识别中的应用,并对未来发展趋势进行了展望。 2017年12月25 00:00 2017年06期 770 780 2053045 宋婉茹, 赵晴晴, 陈昌红, 干宗良, 刘峰 基于门禁日志挖掘的内部威胁异常行为分析 /oa/darticle.aspx?type=view&id=201706041 门禁系统是保护重要场所安全的重要手段,可以有效防止未授权用户的进入。然而,近年来大量案例表明重要场所的威胁主要来自于具有合法权限的内部人员。针对这个问题,提出基于门禁日志数据挖掘的内部威胁异常行为分析方法。该方法首先利用PrefixSpan算法对正常行为序列进行提取,之后计算待检测序列的序列异常度分数,并根据决策者设定的阈值来找出异常序列。通过真实门禁数据中的实验,验证了本方法可以降低精确匹配在数据较少时带来的高误报率,实现对内部人员异常行为的有效发现,为加强重要场所安全保护提供了新的途径。 2017年12月25 00:00 2017年06期 781 789 3945746 王培超, 周鋆, 朱承, 黄金才, 张维明 出租车数据的城市道路网路段通行时间估计方法 /oa/darticle.aspx?type=view&id=201706071 城市路段通行时间估计能够更好地运营和管理城市交通。针对包含起点-终点位置,行程时间和距离信息的GPS行程数据,提出了一种城市道路网短时通行时间的估计模型。首先将城市道路网按照交叉路口分解为多个路段,并基于k-最短路径搜索方法分析司机行进路线。然后针对每一个路段,提出了双车道通行时间多项式关联关系模型,既能提升道路网通行时间精细度,又能避免因训练数据不足导致的路网通行时间过拟合问题。最后以最小化行程期望时间和实际行程时间之间的均方误差为优化目标,拟合道路网通行时间。在纽约出租车数据集上的实验结果表明,所提模型及方法相对于传统单车道估计方法能够更准确地估计城市道路网路段的通行时间。 2017年12月25 00:00 2017年06期 790 798 1760431 黄顺伦, 杜春, 宋宝泉, 李军, 陈浩 基于文本扩展模型的网络视频聚类方法 /oa/darticle.aspx?type=view&id=201706036 随着视频分享网站的兴起和快速发展,互联网上的视频数量呈爆炸式增长,对视频的组织及分类成为视频有效使用的基础。视频聚类技术由于只需要考虑视频数据内在的簇结构、不需要人工干预,越来越受到人们的青睐。现有的视频聚类方法有基于视频关键帧视觉相似性的方法、基于视频标题文本聚类的方法、文本和视觉多模态融合的方法。基于视频标题文本聚类的视频聚类方法由于其简便性与高效性而被企业界广泛使用,但视频标题由于其短文本的语义稀疏特性,聚类效果欠佳。为此,本文面向社会媒体视频,提出了一种社会媒体平台上视频相关多源文本融合的视频聚类方法,以克服由于视频标题的短文本带来的语义稀疏问题。不同文本聚类算法上的实验结果证明了多源文本数据融合方法的有效性。 2017年12月25 00:00 2017年06期 799 805 663834 刘璐<sup>1,2</sup>, 贾彩燕<sup>1,2</sup> 多视角模糊双加权可能性聚类算法 /oa/darticle.aspx?type=view&id=201703031 为解决传统可能性聚类算法(PCM)无法满足多视角学习场景聚类的实际问题,并进一步考虑到现有多视角聚类算法尚未重视的视角权重及视角内特征权重优化问题,本文提出一种新的具备最佳视角及最优特征划分能力的多视角模糊双加权可能性聚类算法(MV-FDW-PCM)。该算法将基于传统的PCM算法,给出了详细的多视角聚类学习框架使得PCM算法具备多视角聚类能力,进而通过引入视角间模糊加权机制及视角内属性模糊加权机制解决视角间权重及视角内特征权重优化问题。实验结果表明,所提的MV-FDW-PCM算法在面对多视角聚类问题时较以往算法具有更佳的聚类效果。 2017年12月25 00:00 2017年06期 806 815 1696147 蒋亦樟<sup>1</sup>, 朱丽<sup>1</sup>, 刘丽<sup>2</sup>, 王士同<sup>1</sup> 稀疏化的因子分解机 /oa/darticle.aspx?type=view&id=201706030 因子分解机(简称为FM)是最近被提出的一种特殊的二阶线性模型,不同于一般的二阶模型,FM对二阶项系数进行了分解,这种特殊的结构使得FM特别适用于高维且稀疏的数据。虽然FM在推荐系统领域已获得了应用,但FM本身并未显式考虑变量的稀疏性,特别当变量中包含结构稀疏信息时。因此,FM的二阶特征结构使其特征选择时应当满足这样一种性质,即涉及同一个特征的线性项和二阶项要么同时被选要么同时不被选,当该特征是噪音时,应当同时不被选,而当该特征是重要变量时,应当同时被选。考虑到这种结构特性,本文提出了一种基于稀疏组Lasso的因子分解机(SGL-FM),通过添加稀疏组Lasso的正则项,不仅实现了组间稀疏,还实现了组内稀疏。从另一个角度看,组内稀疏也相当于对因子分解的维度<i>k</i>进行了控制,使其能根据数据的不同而自适应地调整维度<i>k</i>。实验结果表明,本文提出的方法在保证了相当精度甚至更优精度的情况下,获得了比FM更稀疏的模型。 2017年12月25 00:00 2017年06期 816 822 862967 郭少成, 陈松灿 规则推理与神经计算智能控制系统改进及比较 /oa/darticle.aspx?type=view&id=201602015 针对生产生活实践中的智能系统在实施控制过程中关键参数的实时在线智能整定与优化问题与需求,实现将不同类型人工智能方法与经典的控制方法对接从而构成多种复合控制(AI-CC)方法,提出改进算法并进行理论分析与仿真对比研究。首先实现了基于规则与模糊推理机制的AI-CC方法,提出了增量式改进算法,进而提出基于小波神经网络的AI-CC方法,进一步对两类智能系统的稳定性进行理论分析,提出稳定性保证算法,最后对比研究不同类型的智能系统在智能程度与性能特征方面的差异。研究成果为该领域研究者提供了多种改进的智能控制算法及其对比参照和理论分析,为该方法在工程实践中低成本地升级并稳定可靠地应用提供可操作方案。 2017年12月25 00:00 2017年06期 823 832 2315746 刘经纬<sup>1,2,3</sup>, 赵辉<sup>4</sup>, 周瑞<sup>1</sup>, 朱敏玲<sup>3</sup>, 王普<sup>5</sup> 基于二阶邻居事件触发多智能体系统的一致性 /oa/darticle.aspx?type=view&id=201702008 在多智能体系统的平均一致性问题中,为了实现每个智能体的状态都加速收敛到所有智能体初始状态的平均值。采用李雅普诺夫函数方法,证明了多智能体系统的平均一致性问题。结合特定的事件触发条件,设计了基于事件的一致性协议,并利用二阶邻居信息来加速多智能体系统的一致性收敛速度。首先在固定拓扑网络下研究了多智能体系统利用二阶邻居信息来加速一致性收敛速度的问题,随后在切换拓扑网络下对类似问题进行了分析。最后,把该协议应用到数值仿真中,并与只利用一阶邻居信息的协议比较,仿真结果表明所设计的协议能够加快收敛速度。 2017年12月25 00:00 2017年06期 833 840 1083897 夏倩倩<sup>1</sup>, 刘开恩<sup>1</sup>, 纪志坚<sup>2</sup> 增量极坐标编码的贝赛尔曲线智能优化算法 /oa/darticle.aspx?type=view&id=201706076 针对基于统计的隶属度函数确定方法进行了改进,使用贝塞尔曲线作为隶属度函数的上升或下降沿,使隶属度函数可以经过统计结果规定的任意中间点。使用新的增量极坐标编码对贝塞尔曲线控制点进行表达,解决了传统贝塞尔曲线优化中的控制点约束问题。采用差分进化算法对贝塞尔曲线控制点进行优化,可智能拟合经过任意点的最佳贝塞尔曲线。算法可扩展到任意阶贝塞尔曲线,所得隶属度函数较非贝塞尔曲线方法更为合理。 2017年12月25 00:00 2017年06期 841 847 955890 肖琴<sup>1</sup>, 张永韡<sup>2</sup>, 汪镭<sup>3</sup> 中医临床不均衡数据疾病分类方法研究 /oa/darticle.aspx?type=view&id=201706046 基于欠采样的不均衡数据分类算法是一种随机数据优化算法,但它不能最好地反映中医临床原始数据的分布并解决数据的特征冗余问题。提出了基于预测风险的最远病例不均衡装袋算法(PRFS-FPUSAB)。该算法中首先基于欠采样提出了改进的抽样方式尽可能地反映原始数据分布,然后结合集成学习、预测风险标准提高不均衡的分类性能并进行特征选择。在中医临床采集的经络电阻数据上的实验结果表明,该算法改善了曲线下面积并且选择的特征也符合中医学相关理论。 2017年12月25 00:00 2017年06期 848 856 3802284 潘主强<sup>1</sup>, 张林<sup>1</sup>, 张磊<sup>2</sup>, 李国正<sup>3</sup>, 颜仕星<sup>4</sup> 基于医学征象和卷积神经网络的肺结节CT图像哈希检索 /oa/darticle.aspx?type=view&id=201706035 针对肺结节图像检索中存在的两个问题:手工设计的特征对肺结节的表达能力不强,生成的哈希码检索效果不佳。文中提出一种基于医学征象和卷积神经网络的肺结节CT图像哈希检索方法。首先,依据肺结节的9种征象取值,构造训练集准确的哈希码;其次,利用卷积神经网络和主成分分析法提取肺结节的重要语义特征,并结合训练集准确的哈希码反向求解哈希函数;最后,提出一种基于自适应比特位的检索方法,实现待查询肺结节图像的快速检出。通过对数据集进行实验和分析,证实了本文方法在肺结节图像检索过程中取得了较高的准确率和检索精度。 2017年12月25 00:00 2017年06期 857 864 1090497 杨晓兰<sup>1</sup>, 强彦<sup>1</sup>, 赵涓涓<sup>1</sup>, 杜晓平<sup>2</sup>, 赵文婷<sup>1</sup> 一种基于密度的SMOTE方法研究 /oa/darticle.aspx?type=view&id=201706049 重采样技术在解决非平衡类分类问题上得到了广泛的应用。其中,Chawla提出的SMOTE(Synthetic Minority Oversampling Technique)算法在一定程度上缓解了数据的不平衡程度,但这种方法对少数类数据不加区分地进行过抽样,容易造成过拟合。针对此问题,本文提出了一种新的过采样方法:DS-SMOTE方法。DS-SMOTE算法基于样本的密度来识别稀疏样本,并将其作为采样过程中的种子样本;然后在采样过程中采用SMOTE算法的思想,在种子样本与其<i>k</i>近邻之间产生合成样本。实验结果显示,DS-SMOTE算法与其他同类方法相比,准确率以及<i>G</i>值有较大的提高,说明DS-SMOTE算法在处理非平衡数据分类问题上具有一定优势。 2017年12月25 00:00 2017年06期 865 872 1750254 王俊红, 段冰倩 聚类有效性评价新指标 /oa/darticle.aspx?type=view&id=201706029 聚类有效性评价指标分为外部评价指标和内部评价指标两大类。现有外部评价指标没有考虑聚类结果类偏斜现象;现有内部评价指标的聚类有效性检验效果难以得到最佳类簇数。针对现有内外部聚类评价指标的缺陷,提出同时考虑正负类信息的分别基于相依表和样本对的外部评价指标,用于评价任意分布数据集的聚类结果;提出采用方差度量类内紧密度和类间分离度,以类间分离度与类内紧密度之比作为度量指标的内部评价指标。UCI数据集和人工模拟数据集实验测试表明,提出的新内部评价指标能有效发现数据集的真实类簇数;提出的基于相依表和样本对的外部评价指标,可有效评价存在类偏斜与噪音数据的聚类结果。 2017年12月25 00:00 2017年06期 873 882 2162192 谢娟英, 周颖, 王明钊, 姜炜亮 广义优势多粒度直觉模糊粗糙集及规则获取 /oa/darticle.aspx?type=view&id=201706034 优势关系粗糙集模型是研究序信息系统中数据挖掘的主要方法。为了丰富现有优势关系粗糙集模型,使其更加有效地应用于实际问题,本文首先在直觉模糊决策信息系统中利用三角模和三角余模定义了3种优势关系,得到了3种优势类;其次构造了广义优势关系多粒度直觉模糊粗糙集模型,讨论了该模型的主要性质;随后给出如何从直觉模糊决策信息系统中获取逻辑连接词为“或”的决策规则;最后通过实例说明该模型在处理直觉模糊决策序关系信息系统时是有效的。 2017年12月25 00:00 2017年06期 883 888 1905745 梁美社<sup>1,2</sup>, 米据生<sup>1</sup>, 赵天娜<sup>1</sup> 因素空间中属性约简的区分函数 /oa/darticle.aspx?type=view&id=201609014 粗糙集用属性所构建的信息系统来描写事物,用各种细化的熵指标来实现信息的标度,为挖掘知识的关系数据库提供了数学基础,当前人们最关注的是她在属性约简中所能发挥的作用。但是它用以约简的区分函数定义不清楚,当没有属性能区分两个对象时,相应的属性变量为什么不取0而是取1?这一问题成为粗糙集应用的一个瓶颈。本文的目的是要为区分函数寻找更合理的解释和运用。所采用的方法是,首先要对属性名之间的运算要下定义,属性名与属性值不同,如果用属性值的运算来代替属性名的运算,就会在理解上出现混乱。为此,我们用因素空间的理论,将属性名视为因素,用因素之间的运算来定义属性名的运算,使区分函数有了明确的定义,同时也清楚解释了属性变量在特殊情况下为何取1的问题。这一结果说明因素空间可以加深粗糙集的理论基础,提高其解决问题的能力。 2017年12月25 00:00 2017年06期 889 893 1721273 曲国华<sup>1</sup>, 李春华<sup>1</sup>, 张强<sup>2</sup> 基于自编码器的特征迁移算法 /oa/darticle.aspx?type=view&id=201706037 近年来,栈式自编码网络(stacked auto-encoder,SAE)在大规模数据集上表现出优异的图像分类性能。相对于其他图像分类方法中手工设计的低级特征,SAE的成功归因于深度网络能够学习到丰富的中级图像特征。然而,估计上百万个网络参数需要非常庞大的带标签的图像样本数据集。这样的性质阻止了SAE在小规模训练数据上的许多应用。在这篇文章中,提出的算法展示如何将SAE在大规模数据集上学习到的图像表示有效地迁移到只有有限训练数据的视觉识别任务中。实验部分设计了一个方法来复用在MNIST数据集上训练得到的隐藏层,以此计算在MNIST-variations数据集上的中级图像表示。实验结果展示了尽管两个数据集之间存在差异,但是被迁移的图像特征能够使得模型的分类性能得到极大的提升。 2017年12月25 00:00 2017年06期 894 898 2283145 杨梦铎<sup>1</sup>, 栾咏红<sup>1</sup>, 刘文军<sup>1</sup>, 李凡长<sup>2</sup> 切换系统的鲁棒二次公共Lyapunov函数矩阵寻找算法 /oa/darticle.aspx?type=view&id=201605012 为了获得不确定线性切换系统稳定性判别的公共二次Lyapunov函数寻找方法,提出了鲁棒公共二次Lyapunov函数的概念,运用矩阵不等式分析,得到了在鲁棒稳定矩阵集对合和不对合的情况下,鲁棒公共二次Lyapunov函数存在的充分性条件以及LMI形式的递推搜寻算法。获得的结果便于计算机实现,对不确定切换系统鲁棒稳定性判别具有一定价值。应用仿真测试验证了其正确性。 2017年12月25 00:00 2017年06期 899 905 852176 张晓宇, 李平