检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:何俊 张彩庆[2] 李小珍 张德海[3] He Jun;Zhang Caiqing;Li Xiaozhen;Zhang Dehai(College of Information Engineering,Kunming University,Kunming 650214,China;College of Foreign Languages,,Yunnan University,Kunming 650206,China;College of Software,Yunnan University,Kunming 650206,China)
机构地区:[1]昆明学院信息工程学院,昆明650214 [2]云南大学外国语学院,昆明650206 [3]云南大学软件学院,昆明650206
出 处:《计算机应用研究》2021年第1期83-87,共5页Application Research of Computers
基 金:国家自然科学基金资助项目(61263043,61864004);云南省地方本科高校基础研究联合专项基金资助项目(2017FH001-05)。
摘 要:针对数据清洗中规则间逻辑冲突频发和出错率高的问题,提出一种基于偏序集的规则链自动生成方法。通过分层组合的数据清洗框架自顶向下对规则进行分类处理,采用偏序集和哈斯图自动生成每个层级的逻辑正确和一致的规则链,并设计出对应的生成算法和自动清洗算法。以扶贫领域数据为例进行实验,结果表明该方法使数据清洗效率有一定提升,清洗结果出错率明显降低,检验了方法的科学性和有效性。In order to solve the problem of frequent logical conflicts and high error rate between rules in data cleaning,this paper proposed an automatic rule chain generation method based on partial order set.It classified and processed the rules from top to bottom by the hierarchical data cleaning framework.It automatically generated the rules chain of each level by using partial order set and Hasse diagram,and designed the corresponding generation algorithm and automatic cleaning algorithm.Taking the data of poverty alleviation as an example,the results show that the proposed method can improve the efficiency of data cleaning,reduce the error rate of cleaning results,and test the scientificity and effectiveness of the method.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.220.216.164