[1]沈健,夏鸿斌,刘渊.双关系预测与特征融合的实体关系抽取模型[J].智能系统学报,2024,19(2):462-471.[doi:10.11992/tis.202204047]
SHEN Jian,XIA Hongbin,LIU Yuan.Entity relation extraction model with dual relation prediction and feature fusion[J].CAAI Transactions on Intelligent Systems,2024,19(2):462-471.[doi:10.11992/tis.202204047]
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
19
期数:
2024年第2期
页码:
462-471
栏目:
人工智能院长论坛
出版日期:
2024-03-05
- Title:
-
Entity relation extraction model with dual relation prediction and feature fusion
- 作者:
-
沈健1, 夏鸿斌1,2, 刘渊1,2
-
1. 江南大学 人工智能与计算机学院, 江苏 无锡 214122;
2. 江苏省媒体设计与软件技术重点实验室, 江苏 无锡 214122
- Author(s):
-
SHEN Jian1, XIA Hongbin1,2, LIU Yuan1,2
-
1. School of Artificial Intelligence and Computer, Jiangnan University, Wuxi 214122, China;
2. Jiangsu Key Laboratory of Media Design and Software Technology, Wuxi 214122, China
-
- 关键词:
-
实体关系抽取; 关系三元组; 预训练模型; 双关系预测; 指针网络; 特征融合; 门控线性单元; 条件层规范化
- Keywords:
-
entity relation extraction; relational triple; BERT pretrained model; dual relation prediction; pointer network; feature fusion; gated linear unit; conditional layer normalization
- 分类号:
-
TP391
- DOI:
-
10.11992/tis.202204047
- 文献标志码:
-
2023-11-13
- 摘要:
-
现有分阶段解码的实体关系抽取模型仍存在着阶段间特征融合不充分的问题,会增大曝光偏差对抽取性能的影响。为此,提出一种双关系预测和特征融合的实体关系抽取模型(entity relation extraction model with dual relation prediction and feature fusion,DRPFF),该模型使用预训练的基于Transformer的双向编码表示模型(bidirectional encoder representation from transformers, BERT)对文本进行编码,并设计两阶段的双关系预测结构来减少抽取过程中错误三元组的生成。在阶段间通过门控线性单元(gated linear unit,GLU)和条件层规范化(conditional layer normalization,CLN)组合的结构来更好地融合实体之间的特征。在NYT和WebNLG这2个公开数据集上的试验结果表明,该模型相较于基线方法取得了更好的效果。
- Abstract:
-
The staged decoding entity relation extraction model still has an insufficient feature fusion problem between stages, which increases the impact of exposure bias on the extraction performance. Herein, we propose a new entity relation extraction model with dual relation prediction and feature fusion (DRPFF). DRPFF uses a pretrained model of bidirectional encoder representation from transformers to encode texts, and a two-stage dual relation prediction structure is developed to reduce the false triples’ generation. Between stages, a structure combining gated linear units and conditional layer normalization is utilized to fuse features better between entities. Experimental findings on two public datasets, NYT and WebNLG, demonstrate that the presented method has better results than the baseline methods.
备注/Memo
收稿日期:2022-04-29。
基金项目:国家自然科学基金项目(61972182).
作者简介:沈健,硕士研究生,主要研究方向为自然语言处理、实体关系抽取。E-mail:1452112297@qq.com;夏鸿斌,教授, 博士,江苏省特色化软件人才培养专委会委员,江南大学人工智能与计算机学院副院长。主要研究方向为大数据分析与处理、个性化推荐系统、自然语言处理。主持工信部、江苏省科研项目2项,参加国家科技支撑项目1项、江苏省自然科学基金重点项目1项。获江苏省教育成果二等奖、教育部科技成果奖、中国商业联合会科技进步特等奖。发表学术论文20余篇。E-mail:hbxia@jiangnan.edu.cn;刘渊,教授,博士生导师,中国网络空间安全协会会员,江南大学人工智能与计算机学院院长,主要研究方向为网络安全、社交网络。作为项目负责人完成省部级科研项目多项。获中国商业联合会科技奖特等奖、无锡市有突出贡献的中青年专家称号。发表学术论文40余篇。E-mail:lyuan1800@sina.com
通讯作者:夏鸿斌. E-mail:hbxia@jiangnan.edu.cn
更新日期/Last Update:
1900-01-01