检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赵倩倩[1] ZHAO Qian - qian(Physical Education College ,Zhengzhou University,Zhengzhou Henan 450044, Chin)
出 处:《计算机仿真》2017年第6期445-448,共4页Computer Simulation
摘 要:由于网络动态数据在不断影响着企业动态竞争环境的形成,因此需要进行动态数据环境下网络重复数据检测方法的研究。但是采用当前方法进行重复数据检测时,无法详细的计算出各数据属性的最终取值种类数,存在重复数据检测精度低的问题。为此,提出一种基于综合加权法的动态数据环境下网络重复数据检测方法。上述方法先利用均值法计算出网络中每个数据属性的最终统一等级,得到数据属性的主观等级向量,给出数据字符串间的编辑距离,对其距离相似度进行计算,融合ISNM方法得到字符关键字,并进行窗口内相邻数据比较,依据比较的结果完成对动态数据环境下网络重复数据检测。实验结果表明,所提方法数据检测精度较高,可以有效地满足对动态数据环境下网络重复数据检测的应用需求。In this paper,we propose a method for detection of network duplicate data under dynamic data environment, using comprehensive weighted method. Method of mean value was used to work out uniform grade of each data attribute in network, and subjective grade vector of the data attribute was obtained. Then, editing distance among data character string was provided, and its distance similarity was calculated. Integrated with ISNM method,character key-word was obtained, and adjacent data in window was compared. According to comparative result, the detection of network duplicate data was completed. The conclusions can be drawn from experimental simulation that the method has high precision of data detection and can satisfy application requirement of the detection of network duplicate data.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30