当前位置:首页 > 三种典型聚类算法在职员评定中的应用(已发表)
第 0 次
C1=(A,B,C) C2=(D,E) C3=(F,G) C4=(H,I) C1=(A,E,F,H) C2=(C,D) C3=(G,I) C4=(B) C1=(A,E,H) C2=(C,D) C3=(G,I) C4=(B,F) C1=(A,E,H,I) C2=(C,D) C3=(G) C4=(B,F)
C1=(A,B,C) C2=(D,E) C3=(F,G) C4=(H,I)
第 1 次 第 2 次
C1=(A,C,E,F,H) C2=(D) C3=(G,I) C4=(B) C1=(A,C,E,H,I) C2=(D) C3=(G) C4=(B,F)
第 3 次
k-means在第三次迭代结束,k-medians在第二次迭代结束,可见通过迭代运算, K-medians聚类算法在迭代步数上少于K-means聚类算法。
3.2.算法比较分析
由上表7可知,K-medians聚类算法在迭代速度上优于K-means聚类算法,且K-medians聚类算法和Q-型聚类算法对该数据处理的聚类结果相同,但是K-means聚类算法的聚类结果和前两者稍有不同。
而K-means聚类算法中存在差异的一项 Ⅱ类:{C ,D},结合原始数据分析,我们可以知道,C 相对别人来说差异性不是很大,而D是相对别人在担任其它工作方面相当突出的,因此有必要将D单独列出来,而将C归入相似的一类 I 类。
进一步分析发现,K-medians聚类算法和Q-型聚类分析算法的聚类结果中反观他们的工作业绩, I类员工为工作水平及客户评价都很好的员工,Ⅱ类员工为各个方面一般的员工,Ⅲ类为担任其他工作量较多者,Ⅳ类为研发新产品突出的员工,可知以上分析,符合实际情况。
4.结束语
聚类分析是数据挖掘中的一个重要研究方向,本文将其中三种重要的算法用于公司员工年终评定,并对不同的聚类结果进行比较和分析,研究不同聚类算法在特定领域中的可行性和效率的优略。对一个特定的数据集,很难选择一个最合适的聚类算法进行分
5
析。因此,我们有些时候只能针对具体问题、具体数据提出某种方法。随着研究的深入,针对海量数据,如何构造在计算速度和计算效果即算法性能方面均优于上述的聚类算法也是一个重要的课题,另外,如何结合可视化的计算机技术,来设计专业的应用软件也是一个新的研究热点。
初始数据 特征选择 数据标准化 聚点选择 不合理 图2 聚类过程图
初始划分 合理 最终聚类结果
参考文献
[1] Jiawei Han.Micheline Kamber.Data mining concepts and techniques[M].Beijing:Beijing Higher
Education Press,2001:225
[2] 谢季坚,刘承平.模糊数学方法及其应用[M].武汉: 华中科技大学出版社,2000:96 [3]叶苗群,基于混合K—中心点的Web客户聚类,嘉兴学院学报[J]. 2005,17(3):54
Three kinds representative cluster-algorithm application in the clerk
appraising
PENG Gao-hui ,GUAN Guo-quan ,HE Chun-hua
a
b
c
(a.Department of Mathematics and Information Science,North China Institute of Water Conservancy and Hydroelectric Power,Zhengzhou 450008,China;b.School of Information Engineering and Computer, Jiangxi Agricultural University,Nanchang 330045,China; c.College of Information and Management Science,Henan Agricultural University,Zhengzhou 450002,China) Abstract:
by discussing three important cluster algorithm : Q-type,K-means、K-medians , then derive some conclusions by applying them to the staff year-end-assessment in a company. diversity problem should be based on reality, and have the pertinency field to use different algorithm to be more suitable. at the end,discussed the process of the cluster algorithm and the follow-up job .
Keyword: Data mining, Clustering analysis, K-means,K-medians, Q-type clustering analysis
6
共分享92篇相关文档