[1]古丽娜孜,孙铁利,伊力亚尔,等.一种基于主动学习支持向量机哈萨克文文本分类方法[J].智能系统学报,2011,6(3):261-267.
GU Linazi,SUN Tieli,YI Liyaer,et al.An approach to the text categorization of the Kazakh language based on an active learning support vector machine[J].CAAI Transactions on Intelligent Systems,2011,6(3):261-267.
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
6
期数:
2011年第3期
页码:
261-267
栏目:
学术论文—自然语言处理与理解
出版日期:
2011-06-25
- Title:
-
An approach to the text categorization of the Kazakh language based on an active learning support vector machine
- 文章编号:
-
1673-4785(2011)03-0261-07
- 作者:
-
古丽娜孜1,2,孙铁利2,伊力亚尔1,吴迪2
-
1.伊犁师范学院 电子与信息工程学院,新疆 伊宁 835000;
2.东北师范大学 计算机科学与信息技术学院,吉林 长春 130117
- Author(s):
-
GU Linazi1,2 , SUN Tieli2 , YI Liyaer1, WU Di2
-
1.School of Electronic and Information Engineering, Yili Normal University, Yining 835000, China;
2.School of Computer Science and Information Technology, Northeast Normal University, Changchun 130117, China
-
- 关键词:
-
支持向量机; 哈萨克文文本分类; 主动学习
- Keywords:
-
support vector machine; Kazakh text categorization; active learning
- 分类号:
-
TP391.1
- 文献标志码:
-
A
- 摘要:
-
将文本分类理论应用于哈萨克语中,给出基于支持向量机的哈萨克文文本分类系统的设计思想.从哈萨克语言学的角度对哈萨克文分析,提出哈萨克文词干提取的方法.在对支持向量机的理论分析基础上,提出主动学习算法对支持向量机进行训练,使用训练后的分类器对新的文本进行分类.实验结果表明,该方法在哈萨克文文本分类中能获得可接受的分类性能.
- Abstract:
-
In applying the theory of text categorization to the study to the Kazakh language, an approach to text categorization of Kazakh text based on a support vector machine system was introduced. In this paper, from the Kazakh linguistic angle, the method to extract word stems was analyzed. Based on analysis of the support vector machine, the proposed active learning algorithm was adopted for training. The trained classifier was used to classify new text. The experimental results show that this approach to Kazakh text classification has an acceptable classification performance.
备注/Memo
收稿日期: 2010-10-08.
基金项目:教育部科技发展中心网络时代的科技论文快速共享研究项目(20090043110010);吉林省科技规划资助项目(20090503);吉林省教育厅“十一五”科研规划资助项目(2009587).
通信作者:孙铁利.E-mail:suntl@nenu.edu.cn.
作者简介:古丽娜孜,女,1972年出生,讲师,主要研究方向为数据挖掘、文本分类等,发表学术论文10余篇.
孙铁利,男,1956年出生,教授,博士生导师,伊犁师范学院兼职教授.主要研究方向为智能用户接口、智能信息挖掘.近年来承担国家级、省部级科研项目8项.发表学术论文100余篇,出版专著及教材10余部.
伊力亚尔,男,1978年出生,讲师,主要研究方向为计算机应用、自然语言信息处理,发表学术论文10余篇.
更新日期/Last Update:
2011-07-23