[1]张涛,贾真,李天瑞,等.基于知识库的开放领域问答系统[J].智能系统学报,2018,13(4):557-563.[doi:10.11992/tis.201707039]
ZHANG Tao,JIA Zhen,LI Tianrui,et al.Open-domain question-answering system based on large-scale knowledge base[J].CAAI Transactions on Intelligent Systems,2018,13(4):557-563.[doi:10.11992/tis.201707039]
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
13
期数:
2018年第4期
页码:
557-563
栏目:
学术论文—知识工程
出版日期:
2018-07-05
- Title:
-
Open-domain question-answering system based on large-scale knowledge base
- 作者:
-
张涛, 贾真, 李天瑞, 黄雁勇
-
西南交通大学 信息科学与技术学院, 四川 成都 611756
- Author(s):
-
ZHANG Tao, JIA Zhen, LI Tianrui, HUANG Yanyong
-
School of Information Science and Technology, Southwest Jiaotong University, Chengdu 611756, China
-
- 关键词:
-
问答系统; 开放领域; 实体识别; 实体链接; 知识库
- Keywords:
-
question-answering system; open domain; entity recognition; entity linking; knowledge base
- 分类号:
-
TP391.1
- DOI:
-
10.11992/tis.201707039
- 摘要:
-
问答系统能够理解用户问题,并直接返回答案。现有问答系统大多是面向领域的,仅能回答特定领域的问题。文中提出了基于大规模知识库的开放领域问答系统实现方法。该系统首先采用自定义词典分词和CRF模型相结合的方法识别问句中的主体;其次,采用模糊匹配方法将问句中的主体与知识库中实体建立链接;然后,通过相似度计算以及规则匹配等多种方法识别问句中的谓词并与知识库实体的属性建立关联;最后,进行实体消歧和答案获取。该系统平均F-Measure值为0.695 6,表明所提方法在基于知识库的开放领域问答上具有可行性。
- Abstract:
-
Question-answering (QA) systems can understand user questions and return answers directly. Currently, most QA systems can only answer questions pertaining to specific domains. In this paper, we propose a method for constructing an open-domain QA system based on a large-scale knowledge base. First, we present an approach based on a visual dictionary and a conditional random field (CRF) model to identify the subject in question. Next, we use a fuzzy matching method to link the entity in question to that in the knowledge base, and apply similarity computation and rule matching methods to recognize the question predicates and link them to the attributes of the knowledge entity. Lastly, we implement entity disambiguation and answer retrieval. The mean F-measure value of the proposed system is 0.695 6, which indicates the feasibility of the proposed method for an open-domain QA system for a large-scale knowledge base.
备注/Memo
收稿日期:2017-07-25。
基金项目:国家自然科学基金项目(61573292);国家自然科学基金青年科学基金项目(61603313).
作者简介:张涛,男,1989年生,硕士研究生,主要研究方向为中文信息处理、信息抽取、智能问答;贾真,女,1975年生,讲师,博士,主要研究方向为自然语言理解、中文信息处理、信息抽取、大数据;李天瑞,男,1969年生,教授,博士生导师,博士,主要研究方向为智能信息处理、数据挖掘、云计算和大数据。
通讯作者:张涛.E-mail:tzhangswjtu@163.com.
更新日期/Last Update:
2018-08-25