登录   |   注册   |   网站地图
 
 
首页 > 计算机应用研究 > 具有稀疏特征的对象—属性子空间边缘重叠区域归属算法

具有稀疏特征的对象—属性子空间边缘重叠区域归属算法

计算机应用研究
Application Research of Computers
查看全文
摘要:
【摘要】 通过分析具有稀疏特征的对象—属性子空间的特征,发现其边缘存在交叉重叠区域现象,为此,提出了基于聚类思想的具有稀疏特征的对象—属性子空间边缘的重叠区域归属算法(OASEDA),该算法能有效解决对象—属性子空间的独立性,算法根据子空间内部紧凑度和子空间之间分离度相对大小确定子空间边缘重叠区域的归属,并基于K-means算法结合权重理论设计了重叠区域归属判断目标函数,最后通过实验证明了该方法的有效性。
【关键词】 具有稀疏特征的高维数据; 对象—属性子空间; 对象—属性子空间边缘重叠区域;
引言:

【引言】高维数据是比较常见的一种数据形式,具有稀疏性。随着应用的深入发展,如何从这些具有稀疏特征的高维数据集中挖掘出对用户有用的知识,是目前数据挖掘领域中重要的研究内容之一。受维度效应的影响,传统的聚类算法不能适用于高维数据。经典高维数据聚类算法包括网格聚类算法、密度聚类算法等,而近年来提出的子空间聚类算法因高效、准确的聚类结果而备受关注。子空间聚类的前提和基础是子空间的识别。事实上,子空间识别的研究已经成为高维数据预处理的重要组成部分,并且子空间的质量直接影响最终的子空间聚类,因此,该问题已经引起了学者的关注,正成为当前高维数据聚类研究的热点和难点。二阶段联合聚类算法( MTPCCA)是从聚类的角度来研究具有稀疏特征的高维数据对象—属性子空间的识别问题,能够识别出具有较高质量的对象—属性子空间,但该算法识别出的子空间边缘容易出现边界不清的现象,即子空间边缘存在重叠区域。如图1 所示,区域C既可以认为是对象—属性子空间A 的边缘区域,也可以认为是对象—属性子空间B 的边缘区域,这一部分本文定义为对象—属性子空间重叠区域C。因此,确定该重叠区域的归属对提高子空间质量、减小具有稀疏特征的高维数据预处理时的搜索空间,甚至对具有稀疏特征的高维数据聚类都是非常重要的。鉴于这一点,本文针对具有稀疏特征的对象—属性子空间边缘重叠区域的归属问题提出了子空间边缘检测算法,提高子空间识别的质量。

作者:
祝琴;陈华
作者单位:
南昌大学管理科学与工程系;

知识产权声明 | 服务承诺 | 联系我们 | 人才招聘 | 客服中心 | 充值中心 | 关于我们

Copyright© 中国期刊全文数据库      电子邮件:journals@188.com   备案号:辽ICP备14002692号-1
友情链接:万方数据库
建议采用IE 6.0以上版本,1024*768分辨率浏览本页面