检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:郭晖[1] 董源 周钢[1] GUO Hui;DONG Yuan;ZHOU Gang(Department of Computer Technology,Electronic Engineering School,Naval University of Engineering,Wuhan 430033;Naval Hydrographic and Meteorological Center,Beijing 100000)
机构地区:[1]海军工程大学电子工程学院计算机工程系,武汉430033 [2]海军水文气象中心,北京100000
出 处:《计算机与数字工程》2018年第9期1726-1730,共5页Computer & Digital Engineering
摘 要:字符匹配是数据清洗中提高数据质量的重要途径。针对中文名词简称的匹配问题,在分析现有中文匹配算法的基础上,提出一种基于数据库中各属性关联度的匹配算法,通过对匹配名词所处属性的关联属性的数据对比相似度,按照中文简称和全称数据量设置置信度,从而得到简称匹配度。实例实验表明,该算法具有较好的适用性和准确性。Character data matching is an important way to improve the quality in data cleansing. For the problem of Chinese short term matching,based on the analysis of existing Chinese matching algorithm,a new matching algorithm is proposed based on database each attributes associated degree. Abbreviated matching degree is counted by the associated attribute comparison similarity in which Chinese abbreviated term is confident in accordance with the amount of data of Chinese abbreviated and full name.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117