检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王方心 潘巍[1,2,3] 吴立锋[1,2,3] 金声震[1,2,3] 李晓娟[1,2,3]
机构地区:[1]首都师范大学信息工程学院,北京100048 [2]首都师范大学高可靠嵌入式系统技术北京市工程研究中心,北京100048 [3]首都师范大学电子系统可靠性技术北京市重点实验室,北京100048
出 处:《计算机工程与设计》2014年第1期248-254,共7页Computer Engineering and Design
基 金:国家自然科学基金项目(61070049;61202027);国际科技合作基金项目(2012DFA11340);北京市自然科学基金项目(4122015);北京市教育委员会科技计划面上基金项目(KM201210028001);电子系统可靠性技术北京市重点实验室2012年阶梯计划基金项目(Z121101002812006)
摘 要:结合属性重要度和灰色关联度,提出了一种新的数据补齐方法,可使补齐后的数据具有更高的识别率和分类性能。按照属性重要度确定各个条件属性的补齐顺序;对于当前要补齐的缺失样本,将所有完备样本分别与其进行比较,并选择灰色关联度最大的完备样本对该样本的缺失数据进行补齐。并提出了一种新的判断数据补齐性能的评价标准,即补齐后的数据不能影响原有数据的识别率。实验结果表明,即使在很高的数据缺失比率下,该方法仍能很好地进行补齐,并能取得较高的识别率。A new imputation method is proposed based on the attribute significance and the grey correlation to improve classifica tion ability. First, the imputation sequence is sorted by the attribute significance; then, the sample in complete dataset is selec ted, which has the highest grey correlation with imputation-needed samples; ultimately, imputation is made on incomplete sam ples with the correspond attributes. In addition, a new evaluation criteria is put forward for imputation performance, i.e. the im puted data has no or tiny effect on original classification ability. Experimental results show that this method can boost the classi fication capability of data sets, even under the circumstance that large missing proportion exists.
关 键 词:不完备数据补齐 属性重要度 补齐顺序 灰色关联度 评价标准
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229