检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:谭明超[1] 刁兴春[1] 曹建军[1] 冯径[2]
机构地区:[1]解放军理工大学指挥信息系统学院,南京210007 [2]解放军理工大学气象海洋学院,南京211101
出 处:《上海交通大学学报》2015年第8期1075-1083,1089,共10页Journal of Shanghai Jiaotong University
基 金:国家自然科学基金项目(61070714);解放军理工大学预研基金项目(20110604)资助
摘 要:属性相似度的准确性是影响实体分辨准确程度的重要因素之一.为提高属性相似度的准确性,分析了属性相似度与函数依赖的关系,给出了属性相似度调整原则,提出了依据函数依赖进行相似度划分、相似度传递调整和计算相似度调整代价的方法,提出了通过属性相似度调整提高属性相似度准确性的属性相似度传递调整算法.实验结果表明,该算法能够更好地区分匹配记录对和不匹配记录对,获得更高的查全率、查准率和F1值.The accuracy of attribute similarity is one of the important factors affecting the precision of entity resolution(ER).To improve the accuracy of attribute similarity,the relation between attribute similarity and functional dependency(FD)was analyzed and the principles for attribute similarity adjusting were suggested.The FD based methods for similarity partition,similarity transitively adjusting and cost computing of similarity adjusting were proposed.An algorithm for attribute similarity adjusting with FD(SAWFD)was put forward to improve the accuracy of attribute similarity.The experiment results show that the algorithm can better distinguish matching and unmatching records,and get higher scores of recall,precision and F1 measure.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.69