检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:尹成祥[1] 张宏军 张睿[1] 綦秀利[1] 王彬[1]
机构地区:[1]解放军理工大学,南京210007
出 处:《科学技术与工程》2014年第15期79-82,92,共5页Science Technology and Engineering
基 金:国家自然科学基金(70971137)资助
摘 要:针对不同属性对数据点之间距离贡献的不同,提出了一种用于距离度量的属性加权策略。标称属性通过属性取值的信息熵进行加权,数值属性通过属性取值的标准差进行加权,混合属性根据标称属性和数值属性综合加权,加权策略可以放大离群点与正常数据之间的差别。仿真实验区分不同的属性类型对所提加权策略进行了验证,实验结果证明了策略的有效性。With respect to the fact that different attribute has different affluence on the distance between data points,a strategy to weight attributes when calculating distance was proposed. According to the strategy,categorical attributes were weighted based on the entropies while numerical ones based on standard deviations. When dealing with mixed attributes,a method was introduced to integrate the weights gained from categorical attributes and numerical ones. The proposed strategy makes the outliers more significant. Experiments on different kinds of data prove the effectiveness of the proposed strategy.
关 键 词:属性加权 信息熵 标准差 局部离群点因子(local cutlier factor LOF)算法
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249