一种数据规约的近似挖掘方法的实现  被引量:6

Research and Realization of Approximate Data Mining Based on Data Reduction

在线阅读下载全文

作  者:喻小光[1] 陈维斌[1] 陈荣鑫[1] 

机构地区:[1]华侨大学信息科学与工程学院,福建泉州362021

出  处:《华侨大学学报(自然科学版)》2008年第3期370-374,共5页Journal of Huaqiao University(Natural Science)

基  金:福建省青年科技人才创新基金项目(2002J011);华侨大学科研基金资助项目(04HZR17)

摘  要:讨论基于数据规约的近似挖掘技术,在数据预处理阶段对海量数据集进行数据规约.近似数据挖掘的工作流程包括任务定义、数据准备与预处理、数据挖掘建模、结果的解释与评估、模型发布与应用5个阶段.同时,提出使用属性选择和实例选择方法实现近似挖掘的方案,并对该方案进行挖掘效率和结果模型准确性的分析评估.该方案能满足对企业级大数据集进行高效挖掘的需要.Data-reduction-based approximate data mining technique in which data reduction for massive data set was done in data pretreatment phase has been discussed. Approximate data mining work flow includes 5 phases, such as task definition, data preparing and pretreatment, data mining modeling, results explaining and evaluating and model publication~ At the same time, the solution using attribute selection and instance selection to realize the approximation mining is brought out, and the mining efficiency and result model veracity are analyzed and evaluated. The solution can satisfy the need of mining on enterprise level massive data set.

关 键 词:近似挖掘 数据规约 属性选择 实例选择 

分 类 号:TP311.12[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象