[1]杨志豪,洪 莉,林鸿飞,等.基于支持向量机的生物医学文献蛋白质关系抽取[J].智能系统学报,2008,3(4):361-369.
YANG Zhi-hao,HONG L i,L IN Hong-fei,et al.Extraction of information on prote in2prote in interaction from biomedical literatures using an SVM[J].CAAI Transactions on Intelligent Systems,2008,3(4):361-369.
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
3
期数:
2008年第4期
页码:
361-369
栏目:
学术论文—机器学习
出版日期:
2008-08-25
- Title:
-
Extraction of information on prote in2prote in interaction from biomedical literatures using an SVM
- 文章编号:
-
1673-4785 (2008) 04-0361-09
- 作者:
-
杨志豪1 ,洪 莉2 ,林鸿飞1 ,李彦鹏1
-
1. 大连理工大学电子与信息工程学院,辽宁大连116024;
2. 朝阳师范高等专科学校数学计算机系,辽宁朝阳122000
- Author(s):
-
YANG Zhi-hao1 , HONG L i2 , L IN Hong-fei1 , L I Yan-peng1
-
1. College of Electronic and Information Engineering, Dalian University of Technology, Dalian 116024, China;
2. Department ofMath2 ematics and Computer, Chaoyang Teachers College, Chaoyang 122000, China
-
- 关键词:
-
关系抽取; 链接语法; 支持向量机
- Keywords:
-
interaction extraction; link grammar; support vectormachine ( SVM)
- 分类号:
-
TP391
- 文献标志码:
-
A
- 摘要:
-
从生物医学文献中抽取蛋白质(基因)交互作用关系对蛋白质知识网络的建立、蛋白质关系的预测以及新药的研制等均具有重要的意义. 提出了一种基于支持向量机( SVM)的蛋白质(基因)交互作用关系抽取方法. 该方法除了选取词项特征、关键词特征、实体距离特征、链接特征外,还利用链接语法分析方法可以获得较高准确率的特性, 引入链接语法分析方法抽取结果特征. 实验结果表明,该方法的召回率性能与使用同一测试语料的其他系统相比具有明显的优势,综合分类率F指标也高于其他系统.
- Abstract:
-
Automated extraction of p rotein2p rotein interaction information from biomedical literature is helpful when building a p rotein knowledge network, p redicting p rotein functions and designing new drugs. This paper p resents a method for p rotein2p rotein interaction extraction from biomedical literature using a support vectormachine ( SVM). In thismethod, besides common index parameters such asword features, keyword features, entity distance features and link path features, a link grammar extraction feature is used to imp rove p recision when identifying p rotein2p ro2 tein interactions. Experimental results indicated that the recall rate and the F2score of thismethod are much higher than that of other extraction systems for the same dataset
备注/Memo
收稿日期: 2008-05-07.
?基金项目:国家自然科学基金资助项目( 60373095, 60673039) ;国家 “863”高科技计划资助项目(2006AA01Z151) .
作者简介:
杨志豪,男, 1973年生,讲师,主要研究方向为文本挖掘和中文信息处理, 发表学术论文20 余篇.
洪 莉,女, 1962年生,副教授,主要研究方向为智能信息处理.
林鸿飞,男, 1962年生,教授,博士生导师,主要研究方向为搜索引擎、文本挖掘、情感计算、中文信息处理以及商业智能的研究. 主持2项国家自然科学基金和1 项国家863 高科技计划研究项目. 发表学术论文百余篇.
通信作者:杨志豪. E-mail: Yangzh@dlut. edu. cn.
更新日期/Last Update:
2009-05-18