智能系统学报
/oa
-
人工智能从弱到强的路径分析
/oa/darticle.aspx?type=view&id=202412012
2025年01月05 00:00
2025年1期
1
1
273046
郑庆华
-
大语言模型安全性:分类、评估、归因、缓解、展望
/oa/darticle.aspx?type=view&id=202401006
大语言模型能够在多个领域及任务上给出与人类水平相当的解答,并且在未经训练的领域和任务上展现了丰富的涌现能力。然而,目前基于大语言模型的人工智能系统存在许多安全性隐患,例如大语言模型系统容易受到难以被察觉的攻击,模型生成的内容存在违法、泄密、仇恨、偏见、错误等问题。并且在实际应用中,大语言模型可能被滥用,生成的内容可能引起国家、人群和领域等多个层面的困扰。本文旨在深入探讨大语言模型面临的安全性风险并进行分类,回顾现有的评估方法,研究安全性风险背后的因果机制,并总结现有的解决措施。具体而言,本文明确了大语言模型面临的10种安全性风险,并将其归类为模型自身安全性风险与生成内容的安全性风险两个方面,并对每种风险进行了详细的分析和讲解。此外,本文还从生命周期和危害程度两个角度对大语言模型的安全风险进行了系统化的分析,并介绍了现有的大语言模型安全风险评估方法、大语言模型安全风险的出现原因以及相应的缓解措施。大语言模型的安全风险是亟待解决的重要问题。
2025年01月05 00:00
2025年1期
2
32
4932230
黄河燕<sup>1</sup>, 李思霖<sup>1</sup>, 兰天伟<sup>1</sup>, 邱昱力<sup>1</sup>, 柳泽明<sup>2</sup>, 姚嘉树<sup>1</sup>, 曾理<sup>1</sup>, 单赢宇<sup>1</sup>, 施晓明<sup>3</sup>, 郭宇航<sup>1</sup>
-
手机表面缺陷的机器视觉检测方法研究进展
/oa/darticle.aspx?type=view&id=202312036
智能手机在现代人们的学习、工作与生活中扮演着十分重要的角色,手机的大批量生产给手机表面(手机屏幕玻璃盖板、手机外壳)缺陷检测工作提出了更高的要求,而基于机器视觉的检测方式能够更加快速准确地实现对手机表面缺陷的检测。以该领域面临的挑战为思路,总结了近10年来基于机器视觉的手机表面缺陷检测的研究进展。首先列举了手机表面存在的典型缺陷,并分析了机器视觉应用于手机表面缺陷检测工作中面临的部分难题,其中包括算法的精度、实时性、鲁棒性3个方面;然后分别针对上述问题的改进方法进行了分析与对比;进一步总结了目前可供使用的手机表面缺陷数据集及算法的性能评价指标;最后根据手机表面缺陷检测领域面临的问题进行了总结与展望。
2025年01月05 00:00
2025年1期
33
51
3848535
吴一全, 庞雅轩
-
图推理嵌入动态自注意力网络的文档级关系抽取
/oa/darticle.aspx?type=view&id=202311021
文档级关系抽取是指从文档中抽取所有具有语义关系的实体对并判断其关系类别,与句子级关系抽取不同,这里实体关系的确定需要根据文档中多个句子推理得到。现有方法主要采用自注意力进行文档级关系抽取,但是运用自注意力进行文档级关系抽取需要面临两个技术挑战:即长文本语义编码存在的高计算复杂度和关系预测需要的复杂推理建模,故提出一种图推理嵌入动态自注意力网络(graph reasoning embedded dynamic self-attention network, GSAN)模型。该模型借助门限词选择机制动态选择重要词计算自注意力实现对长文本语义依赖的高效建模,同时考虑以选择词为全局语义背景与实体候选、文档节点一起构建文档图,将文档图的图推理聚合信息嵌入到动态自注意力模块中,实现模型对复杂推理建模的能力。在公开的文档级关系数据集CDR和DocRED上的实验结果表明,文中提出的模型较其他基线模型有显著提升。
2025年01月05 00:00
2025年1期
52
63
6563809
李云洁<sup>1</sup>, 王丹阳<sup>2</sup>, 刘海涛<sup>1,3</sup>, 汪华东<sup>4</sup>, 汪培庄<sup>3</sup>
-
结合倒残差自注意力机制的遥感图像目标检测
/oa/darticle.aspx?type=view&id=202312001
针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,构造多尺度空间金字塔池化模块,提供多尺度感受野,增强捕捉不同尺寸目标的能力;最后,提出轻量级特征融合模块,对骨干网络提取的特征图进行融合,充分结合低层与高层特征,提高网络对不同尺寸目标的检测能力。与传统网络及其他改进目标检测算法进行对比,实验发现该方法的检测精度明显优于其他算法。此外,在DIOR数据集和RSOD数据集上设计消融实验,结果表明,该方法在DIOR数据集与RSOD数据集上的平均精度均值比YOLOv8算法分别提升4.6和4.2百分点,明显提升遥感图像目标检测的精度。
2025年01月05 00:00
2025年1期
64
72
5670305
赵文清<sup>1,2</sup>, 赵振寰<sup>1</sup>, 巩佳潇<sup>1</sup>
-
基于改进DDQN船舶自动靠泊路径规划方法
/oa/darticle.aspx?type=view&id=202401005
船舶在自动靠泊过程中会受到风、浪、流和岸壁效应等因素的影响,故需要精确的路径规划方法防止靠泊失败。针对全驱动船舶靠泊过程的基于双深度Q网络(double deep Q network,DDQN)算法,设计了一种船舶自动靠泊路径规划方法。首先建立船舶三自由度模型,然后通过将距离、航向、推力、时间和碰撞作为奖励或惩罚,改进奖励函数。随后引入DDQN来学习动作奖励模型,并使用学习结果来操纵船舶运动。通过追求更高的奖励值,船舶可以自行找到最优的靠泊路径。实验结果表明,在不同水流速度下,船舶都可以在完成靠泊的同时减小时间和推力,并且在相同水流速度下,DDQN算法与Q-learning、SARSA(state action reward state action)、深度Q网络(deep Q network, DQN)等算法相比,靠泊过程推力分别减小了241.940、234.614、80.202 N,且时间仅为252.485 s。
2025年01月05 00:00
2025年1期
73
80
4905456
李康斌, 朱齐丹, 牟进友, 菅紫婷
-
面向自闭症辅助诊断的知识蒸馏混合域适应方法
/oa/darticle.aspx?type=view&id=202403030
使用领域自适应方法构建自闭症辅助诊断模型时,通常会面临目标域中混合了来自多个影像中心的样本的情况(即混合目标域),这使得目标域中包含了多个分布。传统领域自适应方法只能处理目标域包含单一分布的情况,而无法直接处理混合目标域的情况。为此,本文提出了一种基于知识蒸馏的混合目标领域自适应模型。具体地,将图卷积网络(graph convolutional network,GCN)作为教师模型,多层感知机(multilayer perceptron,MLP)作为学生模型。针对混合目标域数据分布的多样性,提出了一种新型的对抗知识蒸馏机制,通过对抗训练特征提取器和域鉴别器来减少源域和目标域之间的分布差异;与此同时,使用知识蒸馏,使教师模型在领域自适应的同时将知识传递给学生模型。在ABIDE数据集上验证了算法的有效性,本文方法一方面有效降低了网络的复杂度,另一方面,在混合目标域的分类准确率达到69.17%,与其他领域自适应方法相比效果更好。
2025年01月05 00:00
2025年1期
81
90
4697790
顿家乐, 王骏, 彭汉琛, 李俊诚, 施俊
-
面向道路交通场景的高效3D目标检测
/oa/darticle.aspx?type=view&id=202311013
针对当前两阶段的点云目标检测算法PointRCNN: 3D object proposal generation and detection from point cloud 在点云降采样阶段时间开销大以及低效性的问题,本研究基于PointRCNN网络提出RandLA-RCNN(random sampling and an effectivelocal feature aggregator with region-based convolu-tional neural networks)架构。首先,利用随机采样方法在处理庞大点云数据时的高效性,对大场景点云数据进行下采样;然后,通过对输入点云的每个近邻点的空间位置编码,有效提高从每个点的邻域提取局部特征的能力,并利用基于注意力机制的池化规则聚合局部特征向量,获取全局特征;最后使用由多个局部空间编码单元和注意力池化单元叠加形成的扩展残差模块,来进一步增强每个点的全局特征,避免关键点信息丢失。实验结果表明,该检测算法在保留PointRCNN网络对3D目标的检测优势的同时,相比PointRCNN检测速度提升近两倍,达到16 f/s的推理速度。
2025年01月05 00:00
2025年1期
91
100
5730475
陆军, 鲁林超, 翟晓阳, 刘霜
-
融合样本关系优化和重排序的换衣行人重识别
/oa/darticle.aspx?type=view&id=202404005
针对换衣行人重识别模型存在局部特征提取能力有限、样本关系优化不足的问题,提出一种融合样本关系优化和重排序的换衣行人重识别模型。首先,设计具有短路连接结构的Transformer模型,将网络的初始特征与深层特征进行融合,来优化每一个样本的特征表示;其次,引入圆损失对优化难度不同的样本赋予不同的权重,更好地优化不同样本之间的关系;最后,设计k′-互近邻重排序策略,对样本间相似性排名进行重新排序,来进一步提高重识别的准确率。在公开的换衣数据集上进行对比实验,结果表明本文提出的模型相比其他先进模型取得了更好的重识别效果。
2025年01月05 00:00
2025年1期
101
108
5088614
丁钰<sup>1</sup>, 毕晓君<sup>2,3</sup>
-
一种用于联合低光增强和人脸超分的深度学习网络
/oa/darticle.aspx?type=view&id=202406029
在低光环境下,人脸图像增强是许多任务的重要恢复方法。然而,现有的低光环境下人脸超分辨率方法通常依赖于低光增强和超分算法的序列建模。遗憾的是,由于优化目标之间的差异,使用这种方法来增强人脸图像很容易导致伪影或噪声。为了应对这一挑战,本文提出了一个端到端的低光人脸图像超分辨率网络(low-light face super resolution network, LFSRNet)。该网络由浅层特征提取、深层特征提取和特征过滤上采样3个模块组成。首先浅层特征模块将输入的低光、低分辨率人脸图像映射到特征空间。随后,深度特征提取模块对其进行亮度校正并细化结构。最后,特征过滤上采样模块处理提取到的特征并重建人脸图像。此外,为了更好地重建丢失的面部细节本文还设计了一个损失函数faceMaskLoss。大量实验证明了所提模型的有效性。
2025年01月05 00:00
2025年1期
109
117
5005530
丛维仪, 郑卓然, 贾修一
-
特征差异增强与残差蒸馏网络结合的医药可见光图像异物检测
/oa/darticle.aspx?type=view&id=202311023
医药中的异物通常形态微弱,导致轻量化算法无法准确检测,而高精度算法通常实时性差。为兼顾医药异物检测的实时性与准确性,提出了一种深度学习蒸馏算法,能够快速、准确地检测药液图像中的异物。首先,在教师网络中引入基于语义特征的上采样方法,增强了教师网络与学生网络之间的特征差异。同时,在学生网络的训练图像中加入随机噪声,提高了在高干扰场景下的鲁棒性。为验证算法的有效性,在灯检设备采集了药液异物数据集并进行了对比实验,蒸馏后平均精度提升了4.1百分点,每秒帧数达到了65,优于目前已有的先进方法。最后,在天池酒液数据集进行拓展实验,检测的平均精度提升了3.9百分点,验证了模型在类似场景中的适用性。
2025年01月05 00:00
2025年1期
118
127
5828054
刘优武<sup>1</sup>, 张辉<sup>2</sup>, 孔森林<sup>1</sup>, 陶岩<sup>1</sup>, 李冲<sup>3</sup>
-
基于改进序列凸优化的多无人机航迹规划方法
/oa/darticle.aspx?type=view&id=202312035
随着人工智能技术的迅速发展,利用多架无人机执行飞行任务成为研究的热点之一。本文研究多架无人机到达同一目标点的航迹规划问题,首先建立最优控制问题,采用符号距离函数将非凸避障约束进行凸化;接着考虑了无人机离散序列间的避障约束,保证在连续时间内多无人机的飞行安全;最后提出了自适应信赖域序列凸优化算法,能够保证在每次序列迭代中都能找到近似凸子问题的解,快速求解得到多无人机最优航迹。该算法适用于威胁环境下多无人机协同到达指定的目标点,具有较快的收敛速度。
2025年01月05 00:00
2025年1期
128
138
7289320
穆凌霞<sup>1</sup>, 李筱<sup>1</sup>, 王斑<sup>2</sup>, 张友民<sup>3</sup>, 冯楠<sup>4</sup>, 薛向宏<sup>1</sup>
-
数据中心冷热电联产系统的前摄式智能节能优化算法
/oa/darticle.aspx?type=view&id=202312037
现有的数据中心节能降碳优化方法没有综合考虑碳足迹涉及的能源输入、生产耗能以及废余利用等环节的耦合性,难以实现系统性节能降碳。为此,提出了一种基于深度强化学习的优化算法DeepCCHP(deep combined cooling, heating and power generation),针对数据中心冷热电联产系统,联合控制供电子系统和制冷子系统,优化用电成本、碳排放量和能效。DeepCCHP结合长、短期时间序列网络和深度强化学习方法对联合优化问题进行求解,实现前摄式的联合控制发电设备和制冷设备。在基于Trnsys软件的仿真环境中,通过阿里巴巴数据中心集群数据的训练和验证。实验结果表明,与基准算法相比,DeepCCHP算法可以节省最高40%的成本和28%的碳排放量,且能够在能源成本、碳排放和能效三者之间取得更好的折中与平衡。
2025年01月05 00:00
2025年1期
139
149
5370927
李庆华<sup>1</sup>, 冉泳屹<sup>1</sup>, 刘启晨<sup>2</sup>, 孙彤瑶<sup>1</sup>, 陈双武<sup>3</sup>, 雒江涛<sup>1</sup>
-
基于原型引导与自适应特征融合的域适应语义分割
/oa/darticle.aspx?type=view&id=202403010
无监督域自适应技术对于减少计算机视觉任务中的数据标注工作量具有重要意义,尤其在像素级的语义分割中。然而,目标域的特征分布离散和类别不平衡问题,如模糊的类边界和某些类别的样本过少,对无监督域自适应技术构成了挑战。针对上述挑战,本文提出了一种原型引导的自适应特征融合模型。其中,通过引入原型引导的双重注意力网络融合空间和通道注意力特征,增强类内紧凑性。此外,本文提出自适应特征融合模块,灵活调整各特征的重要性,使网络能够在不同的空间位置和通道上捕捉到更加具有类别区分性的特征,进一步提升语义分割性能。在两个具有挑战性的合成–真实基准GTA5-to-Cityscape和SYNTHIA-to-Cityscape上的实验结果证明了本文方法的有效性,展现出模型对复杂场景和不平衡数据的处理应对能力。
2025年01月05 00:00
2025年1期
150
161
6608587
杨宇宇, 杨霄, 潘在宇, 王军
-
无人艇集群自组织协同围捕控制算法研究
/oa/darticle.aspx?type=view&id=202405025
无人艇(unmanned surface vessel, USV)集群协同围捕是无人艇的重要应用场景之一,文章针对无人艇集群协同围捕任务设计了一种自组织控制算法。考虑到被围对象的加速度未知且仅部分集群成员可对其测量的情况,文章设计了分布式目标状态观测器(distributed target state observer, DTSO),实现围捕过程中各成员对被捕对象状态的一致性观测。设计了一种自组织围捕引导律,解决了围捕算法需要为成员预分配期望位置的问题。设计了分布式非线性模型预测控制(distributed nonlinear model predictive control, DNMPC),解决了执行器饱和与艇间距离约束的问题,实现了满足避碰安全的协同围捕控制。文章分析了控制系统的输入–状态稳定性(input-to-state stability, ISS),并通过多组不同初始状态和改变成员数量的仿真实验,验证了围捕算法的有效性。
2025年01月05 00:00
2025年1期
162
171
5893068
夏桂华, 朱文序, 刘浩岩, 刘兴, 姜享利
-
面向混合数据的对称邻域和微簇合并密度峰值聚类算法
/oa/darticle.aspx?type=view&id=202311005
混合数据是指包含密度分布不均和流形特征的数据集。密度峰值聚类算法局部密度定义方式易忽略密度分布不均数据集类簇间样本的疏密差异,导致误选聚类中心;分配策略依据欧氏距离进行样本分配,不适用于流形数据集同一类簇样本相距较远的情况,致使样本被错误分配。针对这些问题,本文提出一种面向混合数据的对称邻域和微簇合并密度峰值聚类算法。该算法引入对称邻域概念,采用对数倒数累加方法重新定义局部密度,有效提升了聚类中心的识别度;同时,提出了一种基于密度差的微簇个数选取方法,使微簇个数的选取处于合理范围;此外,设计了一种微簇间相似性度量方法进行微簇合并,避免了分配时产生的连带错误。实验表明,相较于对比算法,本文算法在混合数据集、UCI数据集和图像数据集上均取得较好的聚类效果。
2025年01月05 00:00
2025年1期
172
184
6855128
陈威<sup>1,2</sup>, 吕莉<sup>1,2</sup>, 肖人彬<sup>3</sup>, 谭德坤<sup>1,2</sup>, 潘正祥<sup>4</sup>
-
泛逻辑学——逻辑学的大一统理论
/oa/darticle.aspx?type=view&id=202311040
人工智能80年研究实践证明,不能用传统物质学科范式做指导,需要进行学科范式变革,接受信息学科范式的指导。相应的,作为智能学科基础理论之一的逻辑学,也需要进行逻辑范式变革,由数理形式逻辑主导变革为由数理辩证逻辑主导。本文阐述了数理形式逻辑和数理辩证逻辑的区别和关系,确认两者是对立不充分的统一体,具有相互补充、各司其职的关系,本文提出的泛逻辑学,可以在数理形式逻辑的基础上,逐步把它拓展成为数理辩证逻辑。因为数理形式逻辑(标准逻辑、刚性逻辑)是全面受到“非此即彼性”约束的理想化的基本逻辑,而数理辩证逻辑是面向现实世界的具有“亦此亦彼性”、甚至“非此非彼性”的高级逻辑,基本逻辑是高级逻辑的一个特例,如同代数是微积分的特例一样。泛逻辑的使命就是在基本逻辑基础上,逐步放开某些逻辑因素的“非此非彼性”,引入“亦此亦彼性”、甚至“非此非彼性”,形成各种不同的非标准逻辑或超协调逻辑,这些逻辑都是整个数理辩证逻辑的组成部分。而且研究证明,柔性命题逻辑算子与柔性神经元可以存在一体两面的等价关系,神经网络可以不是黑箱,而具有明确的逻辑含义。最后指出,数理辩证逻辑是一个开放的逻辑体系,其边界可以不断扩张,没有上限。泛逻辑可以全面无死角地支撑智能学科范式变革的需要。
2025年01月05 00:00
2025年1期
185
197
3858310
何华灿<sup>1</sup>, 何智涛<sup>2</sup>
-
融合nmODE的术后肺部并发症预测模型
/oa/darticle.aspx?type=view&id=202401007
为了准确预测病人肺部手术后并发症的发生,提出了一种融合神经记忆常微分方程(neural memory ordinary differential equation, nmODE)的并发症预测模型。首先,利用极限梯度提升(extreme gradient boosting, XGBoost)树结构对数据进行编码,并提取其特征重要性。然后,使用长短时记忆神经网络对数据的相关特征依赖性进行分析,并提取处理后的特征。最后,利用nmODE的记忆和学习能力,对提取的特征进行深入分析,并得出最终的预测结果。通过实验评估,在肺部术后并发症数据集中,证明了提出模型的效果优于现有模型,同时可以为预测肺部手术后并发症的发生提供更准确的结果。
2025年01月05 00:00
2025年1期
198
205
3901667
熊立鹏<sup>1</sup>, 徐修远<sup>1</sup>, 牛颢<sup>1</sup>, 陈楠<sup>2</sup>, 章毅<sup>1</sup>
-
面向在线医疗平台的医生推荐方法
/oa/darticle.aspx?type=view&id=202406012
近年来,随着智慧医疗的日益普及,在线医疗平台已逐步发展为满足大众基本医疗需求的重要渠道。为患者推荐合适的医生是在线问诊中的一个重要过程,优化推荐能力不仅可以提高患者的满意度,还能够推动在线医疗平台的发展。与传统推荐系统不同,医生推荐领域受到隐私保护限制,无法查看患者曾经的诊疗历史,因此模型训练时仅能利用每位患者最近一次的就诊记录,面临严峻的数据稀疏问题。同样,模型预测时也仅能根据患者当前的疾病描述文本进行推荐,而由于患者对疾病描述方式的差异性,模型对不同患者的推荐能力也存在差异,这会使部分患者的需求无法得到满足,进而影响模型整体的推荐能力。基于此,本文提出了一种基于数据增强的医生推荐方法(sequential three-way decision with data augmentation, STWD-NA),通过引入不匹配的医患交互信息扩充训练数据,并利用序贯三支决策的思想训练模型。具体来说,该方法由两部分组成:一方面引入了不匹配交互信息的方法,以缓解训练冷启动问题;另一方面,提出了一种基于序贯三支决策的训练算法,以动态调整模型训练时的关注度。最后,通过好大夫平台上的真实数据集验证了本文所提STWD-NA方法的有效性。
2025年01月05 00:00
2025年1期
206
218
4244687
刘珂, 刘盾, 孙扬, 沈蓉萍
-
印刷电路板缺陷持续检测与定位方法研究
/oa/darticle.aspx?type=view&id=202310024
针对目前缺陷检测与定位方法只能对特定类型的缺陷进行检测,而不能连续地学习检测不同类型缺陷的问题,提出了一种基于反向蒸馏模型的缺陷检测与定位方法。该方法以反向蒸馏模型为基础模型,对模型中间层输出的特征图以及一分类嵌入表示进行池化蒸馏,使得模型能够在连续的任务序列上不断地学习新的检测任务,从而达到持续学习的能力。在4个连续的印刷电路板(printed circuit board, PCB)缺陷检测与定位任务上进行实验,实验结果表明该方法的性能优于对比方法,能够满足工业生产场景的应用需求,在抑制对旧任务样本的检测能力的遗忘的同时,能够保持学习检测新任务的能力。
2025年01月05 00:00
2025年1期
219
229
5134463
杨奡飞<sup>1</sup>, 续欣莹<sup>1</sup>, 谢刚<sup>1</sup>, 刘华平<sup>2</sup>
-
多粒度遮挡特征增强的行人搜索算法
/oa/darticle.aspx?type=view&id=202407031
现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了一种场景图多粒度遮挡特征增强算法,对原始场景图进行多粒度随机遮挡,扩充训练数据,并从遮挡后的场景图中生成具有多样化信息的虚拟特征,最后利用生成的虚拟特征增强真实特征中的行人表征。进一步,基于生成对抗学习,该文设计了多粒度特征对齐模块,用于对齐遮挡图像特征和原始图像特征,保持两者语义一致性。实验结果表明,在CUHK-SYSU和PRW数据集上,该算法能够显著提升行人搜索任务的搜索精度。
2025年01月05 00:00
2025年1期
230
242
4918420
苗春玲<sup>1,2</sup>, 张红云<sup>1,2</sup>, 吴卓嘉<sup>1,2</sup>, 张齐贤<sup>1,2</sup>, 苗夺谦<sup>1,2</sup>
-
基于偏序关系的多视图多粒度图表示学习框架
/oa/darticle.aspx?type=view&id=202406010
图池化作为图神经网络中重要的组件,在获取图的多粒度信息的过程中扮演了重要角色。而当前的图池化操作均以平等地位看待数据点,普遍未考虑利用邻域内数据之间的偏序关系,从而造成图结构信息破坏。针对此问题,本文提出一种基于偏序关系的多视图多粒度图表示学习框架(multi-view and multi-granularity graph representation learning based on partial order relationships, MVMGr-PO),它通过从节点特征视图、图结构视图以及全局视图对节点进行综合评分,进而基于节点之间的偏序关系进行下采样操作。相比于其他图表示学习方法,MVMGr-PO可以有效地提取多粒度图结构信息,从而可以更全面地表征图的内在结构和属性。此外,MVMGr-PO可以集成多种图神经网络架构,包括GCN(graph convolutional network)、GAT(graph attention network)以及GraphSAGE(graph sample and aggregate)等。通过在6个数据集上进行实验评估,与现有基线模型相比,MVMGr-PO在分类准确率上有明显提升。
2025年01月05 00:00
2025年1期
243
254
5810472
肖添龙<sup>1,2</sup>, 徐计<sup>1</sup>, 王国胤<sup>3</sup>
-
具身智能的研究与应用
/oa/darticle.aspx?type=view&id=202406044
随着深度学习和大模型技术的不断增强,人工智能技术从研究简单、封闭的虚拟场景,发展到研究更为复杂、开放的现实场景。研究焦点也从早期的小规模语料库和网络文本数据集处理,发展到多模态一体化的处理架构和研究范式。与此同时,以OpenAI Sora为代表的物理世界近似和仿真模型的出现,标志着人工智能再次向通用人工智能迈进了一步。然而,若要让人工智能真正达到通用人工智能的标准,成为类人的智能,需要当今的人工智能体具备与物理世界交互学习的能力,即具身智能。因此,本文主要关注具身智能的研究内容和进展,具体包括具身感知、具身认知和具身行为优化3个方面。同时结合近期人形机器人的发展,概述具身智能技术在人形机器人等载体上的应用,并对未来的研究及应用进行展望。
2025年01月05 00:00
2025年1期
255
262
3211988
张伟男, 刘挺