陈爽

作品数:5被引量:78H指数:3
导出分析报告
供职机构:解放军理工大学更多>>
发文主题:数据清洗数据质量相似重复记录清洗方法SNM更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《上海交通大学学报》《计算机应用研究》《指挥信息系统与技术》《计算机技术与发展》更多>>
所获基金:中国博士后科学基金江苏省博士后科研资助计划项目国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-5
视图:
排序:
数据质量及数据清洗方法被引量:31
《指挥信息系统与技术》2013年第5期63-70,共8页宋金玉 陈爽 郭大鹏 王内蒙 
数据质量问题关系到信息系统建设。首先,概述了数据质量的定义和数据质量问题的分类并总结其来源,介绍了数据质量维度这一数据质量评估指标;然后,说明了不同领域中数据清洗的概念,分析了不同数据质量问题的清洗方法,并归纳了数据清洗有...
关键词:数据质量 数据清洗 清洗方法 数据清洗工具 
基于伸缩窗口和等级调整的SNM改进方法被引量:14
《计算机应用研究》2013年第9期2736-2739,共4页陈爽 刁兴春 宋金玉 曹建军 丁晨路 
中国博士后科学基金特别资助项目(201003797);江苏省博士后科研资助计划项目(0901014B);解放军理工大学预研基金项目(20110604)
对基本邻近排序算法(basic sorted-neighborhood method,SNM)进行分析,指出其不足,提出了SNM算法的一种改进方法。采用变步长伸缩窗口,动态改变检测窗口大小,避免漏配问题,并减少不必要的比较。采用动态调整等级法,根据记录相似度调整...
关键词:数据清洗 相似重复记录 变步长伸缩窗口 动态调整等级 基本邻近排序算法 
基于关系马尔可夫模型的枚举型缺失值估计被引量:2
《上海交通大学学报》2013年第8期1246-1250,共5页陈爽 宋金玉 刁兴春 曹建军 
中国博士后科学基金特别资助项目(201003797);江苏省博士后科研资助计划项目(0901014B);解放军理工大学预研基金项目(20110604)
针对数据质量中数据缺失问题,提出了基于关系马尔可夫模型(RMM)的枚举型缺失值估计方法.该方法充分考虑属性间的关联性,将动态属性选择(DAS)方法与RMM结合,最大限度地利用完整数据的信息,提高了该方法的估计能力;利用RMM计算源状态到目...
关键词:数据缺失 关系马尔可夫模型 动态属性选择 填充方法 
数据清洗及其一般性系统框架被引量:32
《计算机科学》2012年第S3期207-211,共5页曹建军 刁兴春 陈爽 邵衍振 
中国博士后科学基金特别资助项目(201003797);中国博士后科学基金项目(20090461425);江苏省博士后科研资助计划(0901014B);解放军理工大学预研基金项目(20110604)资助
数据清洗是提高数据质量的重要手段之一。从数据产品与传统的有形产品、软件产品相类比的视角,研究数据清洗及其系统框架。数据清洗是数据质量研究的起点,从数据质量发展的角度明确数据清洗的地位和作用,并将其类比为其他产品形式的故...
关键词:数据质量 数据清洗 相似重复记录 不完整记录 框架 
基于列数据库的RDF数据管理实现被引量:3
《计算机技术与发展》2012年第6期53-56,60,共5页王星 宋金玉 陈爽 陈萍 
国家高技术研究发展计划"863"项目(2009AA01Z40)
随着语义网的发展,Web上越来越多的开放数据以RDF格式发布,对海量RDF的有效管理是实现语义网的一个重要条件。文中讨论并分析了现有的几种RDF数据存储方法,针对垂直划分的方法,基于列数据库MonetDB,实现了一个RDF数据管理方案。该方案将...
关键词:资源描述框架 三元组 垂直划分 列数据库 
检索报告 对象比较 聚类工具 使用帮助 返回顶部