数据清洗

作品数:1103被引量:4670H指数:32
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:王宏志于戈周傲英高宏刁兴春更多>>
相关机构:国家电网有限公司华北电力大学信息技术有限公司平安科技(深圳)有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家科技支撑计划x
条 记 录,以下是1-4
视图:
排序:
劣质数据上代价敏感决策树的建立被引量:9
《软件学报》2019年第3期604-619,共16页齐志鑫 王宏志 周雄 李建中 高宏 
国家自然科学基金(U1509216;61472099);国家科技支撑计划(2015BAH10F01)~~
代价敏感决策树是以最小化误分类代价和测试代价为目标的一种决策树.目前,随着数据量急剧增长,劣质数据的出现也愈发频繁.在建立代价敏感决策树时,训练数据集中的劣质数据会对分裂属性的选择和决策树结点的划分造成一定的影响.因此在进...
关键词:代价敏感决策树 劣质数据 数据清洗 误分类代价 测试代价 
基于簇和阈值区间的高效关联规则隐藏算法被引量:9
《计算机研究与发展》2017年第12期2785-2796,共12页牛新征 王崇屹 叶志佳 佘堃 
国家自然科学基金项目(61300192);国家科技支撑计划基金项目(2013BAH33F02);中央高校基本科研业务费专项资金项目(ZYGX2014J052);四川省科技支撑计划基金项目(2015GZ0096);成都市科学技术局软科学研究项目(2015-RK00-00046-ZF);四川省公安厅科研项目(2015SCYYCX06);四川省自贡市公安局项目~~
关联规则隐藏是隐私保护数据挖掘(privacy-preserving data mining,PPDM)的一种重要方法.针对当前的关联规则隐藏算法直接操作事务数据、I/O开销较大的缺陷,提出一种基于FP-tree快速关联规则隐藏的算法FP-DSRRC.算法首先对FP-tree的结...
关键词:隐私保护 关联规则隐藏 频繁模式树 敏感规则 数据清洗 
基于距离-信号模型的RFID数据清洗算法
《组合机床与自动化加工技术》2014年第5期87-91,共5页吴新淼 李少波 唐向红 黄海松 
国家科技支撑计划课题(2012BAF12B14);贵州省重大科技专项(黔科合重大专项字(2012)6018);贵州省科学技术基金项目(黔科合J字[2011]2196号)
针对RFID数据读取不确定性造成的数据冗余和脏数据现象,文章通过标签不同时刻的信号强度估算标签移动的速度和过程时间,利用估算的结果清除冗余数据和脏数据,同时将数据处理和数据输出过程并行执行。该方法大大提升了冗余数据和脏数据...
关键词:RFID 数据清洗 数据处理 数据输出 并发执行 
德温特专利信息清洗与标注模型研究被引量:7
《情报杂志》2013年第8期150-154,203,共6页翟东升 李倩 张杰 黄鲁成 赵京 
国家科技支撑计划项目"面向企业创新应用链的知识管理体系建设与集成应用示范"(编号:2012BAH34F00);国家社会科学基金重大项目"新兴技术未来分析理论方法与产业创新研究"(编号:11&ZD140);北京市自然科学基础资助项目"中文专利侵权检测与分析理论方法及关键技术研究"(编号:9132005)的研究成果之一
专利数据集的质量和处理效率是进行专利分析和知识发现的基础,以构造高质量专利数据集的处理模型为目的,以SQL Server BI为研究平台,设计并实现了德温特专利数据库(DII)信息清洗标注模型。以文本形式的专利信息为数据源,在对各字段内容...
关键词:德温特专利数据库(DII) 专利信息 数据清洗 抽取策略 
检索报告 对象比较 聚类工具 使用帮助 返回顶部