[1]吴钟强,张耀文,商琳.基于语义特征的多视图情感分类方法[J].智能系统学报,2017,12(5):745-751.[doi:10.11992/tis.201706026]
WU Zhongqiang,ZHANG Yaowen,SHANG Lin.Multi-view sentiment classification of microblogs based on semantic features[J].CAAI Transactions on Intelligent Systems,2017,12(5):745-751.[doi:10.11992/tis.201706026]
点击复制
《智能系统学报》[ISSN 1673-4785/CN 23-1538/TP] 卷:
12
期数:
2017年第5期
页码:
745-751
栏目:
学术论文—自然语言处理与理解
出版日期:
2017-10-25
- Title:
-
Multi-view sentiment classification of microblogs based on semantic features
- 作者:
-
吴钟强1,2, 张耀文1,2, 商琳1,2
-
1. 南京大学 计算机软件新技术国家重点实验室, 江苏 南京 210046;
2. 南京大学 计算机科学与技术系, 江苏 南京 210046
- Author(s):
-
WU Zhongqiang1,2, ZHANG Yaowen1,2, SHANG Lin1,2
-
1. State Key Laboratory of Novel Software Technology, Nanjing University, Nanjing 210046, China;
2. Department of Computer Science and Technology, Nanjing University, Nanjing 210046, China
-
- 关键词:
-
情感分析; 文本挖掘; 潜在语义分析; 多模态; 语义特征; 特征融合; 特征提取
- Keywords:
-
sentiment analysis; text mining; latent semantic analysis; multi-view; semantic features; feature fusion; feature extraction
- 分类号:
-
TP181
- DOI:
-
10.11992/tis.201706026
- 摘要:
-
情感分析也称为意见挖掘,是对文本中所包含的情感倾向进行分析的技术。目前很多情感分析工作都是基于纯文本的。而在微博上,除了文本,大量的图片信息也蕴含了丰富的情感信息。本文提出了一种基于文本和图像的多模态分类算法,通过使用潜在语义分析,将文本特征和图像特征分别映射到同维度下的语义空间,得到各自的语义特征,并用SVM-2K进行分类。利用新浪微博热门微博栏目下爬取的文字和配图的微博数据进行了实验。实验结果表明,通过融合文本和图像的语义特征,情感分类的效果好于单独使用文本特征或者图像特征。
- Abstract:
-
The objective in sentiment analysis is to analyze the sentiment tendency contained in subjective text. Most sentiment analysis methods deal with text only and ignore the information provided in the corresponding pictures. In this paper, we propose a multi-view microblog analysis method based on semantic features. Using latent semantic analysis, we map both the text and image features to the semantic space in the same dimensionality, and use SVM-2K to obtain and classify the respective semantic features. We conducted experiments by crawling text and pictures from popular microblogs. The results show that, by combining the semantic features of text and pictures, the sentiment classification result is better than that obtained using text or image features alone.
备注/Memo
收稿日期:2017-06-08。
基金项目:国家自然科学基金项目(61672276);江苏省自然科学基金项目(20161406).
作者简介:吴钟强,男,1992年生,硕士研究生,主要研究方向为文本挖掘、情感分析;张耀文,男,1989年生,硕士研究生,主要研究方向为文本挖掘、情感分析;商琳,女,1973年生,副教授,博士,主要研究方向为计算智能、机器学习、文本挖掘等。
通讯作者:吴钟强.E-mail:wuzqchom@163.com
更新日期/Last Update:
2017-10-25