[1]黄栋,王昌栋,赖剑煌,等.基于决策加权的聚类集成算法[J].智能系统学报编辑部,2016,11(3):418-425.[doi:10.11992/tis.201603030]
HUANG Dong,WANG Changdong,LAI Jianhuang,et al.Clustering ensemble by decision weighting[J].CAAI Transactions on Intelligent Systems,2016,11(3):418-425.[doi:10.11992/tis.201603030]
点击复制
《智能系统学报》编辑部[ISSN 1673-4785/CN 23-1538/TP] 卷:
11
期数:
2016年第3期
页码:
418-425
栏目:
学术论文—机器学习
出版日期:
2016-06-25
- Title:
-
Clustering ensemble by decision weighting
- 作者:
-
黄栋1, 王昌栋2,3, 赖剑煌2,3, 梁云1, 边山1, 陈羽1
-
1. 华南农业大学 数学与信息学院, 广东 广州 510640;
2. 中山大学 数据科学与计算机学院, 广东 广州 510006;
3. 广东省信息安全技术重点实验室, 广东 广州 510006
- Author(s):
-
HUANG Dong1, WANG Changdong2,3, LAI Jianhuang2,3, LIANG Yun1, BIAN Shan1, CHEN Yu1
-
1. College of Mathematics and Informatics, South China Agricultural University, Guangzhou 510640, China;
2. School of Data and Computer Science, Sun Yat-sen University, Guangzhou 510006, China;
3. Guangdong Key Laboratory of Information Security Tec
-
- 关键词:
-
聚类; 聚类集成; 决策加权; 二部图模型; 图分割; 基聚类; 可信度分享; 加权集成
- Keywords:
-
clustering; clustering ensemble; decision weighting; bipartite graph formulation; graph partitioning; base clustering; credit sharing; weighted clustering ensemble
- 分类号:
-
TP18
- DOI:
-
10.11992/tis.201603030
- 摘要:
-
聚类集成的目标是融合多个聚类成员的信息以得到一个更优、更鲁棒的聚类结果。针对聚类成员可靠度估计与加权问题,提出了一个基于二部图模型与决策加权机制的聚类集成方法。在该方法中,每个聚类成员被视作一个包含若干连接决策的集合。每个聚类成员的决策集合享有一个单位的可信度,该可信度由集合内的各个决策共同分享。基于可信度分享的思想,进一步对各个聚类成员内的决策进行加权,并将此决策加权机制整合至一个统一的二部图模型;然后利用快速二部图分割算法将该图划分为若干子集,以得到最终聚类结果。实验结果表明,该方法相较于其他对比方法在聚类效果及运算效率上均表现出显著优势。
- Abstract:
-
The clustering ensemble technique aims to combine multiple base clusterings to achieve better and more robust clustering results.To evaluate the reliability of the base clusterings and weight them accordingly, in this paper, we propose a new clustering ensemble approach based on a bipartite graph formulation and decision weighting strategy. Each base clustering is treated as a bag of decisions, and is assigned one unit of credit. This credit is shared (divided) by all the decisions in one clustering. Using the credit sharing concept, we propose weighting the decisions in the base clusterings with regard to the credit they have. Then, the clustering ensemble problem is formulated into a bipartite graph model that incorporates the decision weights, and the final clustering is obtained by rapidly partitioning the bipartite graph. Experimental results have demonstrated the superiority of the proposed algorithm in terms of both effectiveness and efficiency.
备注/Memo
收稿日期:2016-3-18;改回日期:。
基金项目:国家自然科学基金项目(61573387,61502543);广东省自然科学基金博士启动项目(2016A030310457,2015A030310450,2014A030310180); 广东省科技计划项目(2015A020209124,2015B010108001); 广州市科技计划项目(201508010032); 中央高校基本科研业务费专项项目(16lgzd15)
作者简介:黄栋,男,1987年生,讲师,主要研究方向为数据挖掘与模式识别,发表学术论文10余篇。王昌栋,男,1984年生,讲师,主要研究方向为非线性聚类、社交网络、大数据分析,发表学术论文40余篇。赖剑煌,男,1964年生,教授,博士生导师,博士,广东省图象图形学会理事长,中国图象图形学会常务理事,主要研究方向为生物特征识别、数字图像处理、模式识别和机器学习。主持国家自然科学基金与广东联合重点项目、科技部科技支撑课题各1项,主持国家自然科学基金项目4项。发表学术论文近200篇。
通讯作者:王昌栋.E-mail:changdongwang@hotmail.com.
更新日期/Last Update:
1900-01-01