检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]株洲市统计局,湖南株洲430012 [2]湖南大学计算机与通信学院,湖南长沙410082 [3]长沙大学数学与信息科学系,湖南长沙410003
出 处:《湘潭师范学院学报(自然科学版)》2005年第2期76-78,共3页Journal of Xiangtan Normal University (Natural Science Edition)
基 金:湖南省自然科学基金资助项目(编号:01JJY1007)
摘 要:目前统计分析面临的数据大多不再是预先设定的样本数据,而是杂乱、不规范的大规模的海量数据,所以统计分析之前进行数据预处理是非常必要的。采用数据挖掘技术,对存在空缺值、噪声数据等不规范的数据集进行清理,对海量数据进行维规约和自动产生概念分层处理,以缩小数据集的规模。经过预处理的数据集能更好地适应原有统计方法,并提高了统计质量。
关 键 词:数据挖掘技术 应用 统计分析 海量数据 数据预处理 数据集 样本数据 噪声数据 分层处理 自动产生 统计方法 统计质量 规模 规约
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] F270.7[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.227