基于属性关联相似度的中文简称匹配算法研究  被引量:1

Research of Chinese Abbreviated Name Matching Algorithm Based on the Similarity of Associated Attribute

在线阅读下载全文

作  者:郭晖[1] 董源 周钢[1] GUO Hui;DONG Yuan;ZHOU Gang(Department of Computer Technology,Electronic Engineering School,Naval University of Engineering,Wuhan 430033;Naval Hydrographic and Meteorological Center,Beijing 100000)

机构地区:[1]海军工程大学电子工程学院计算机工程系,武汉430033 [2]海军水文气象中心,北京100000

出  处:《计算机与数字工程》2018年第9期1726-1730,共5页Computer & Digital Engineering

摘  要:字符匹配是数据清洗中提高数据质量的重要途径。针对中文名词简称的匹配问题,在分析现有中文匹配算法的基础上,提出一种基于数据库中各属性关联度的匹配算法,通过对匹配名词所处属性的关联属性的数据对比相似度,按照中文简称和全称数据量设置置信度,从而得到简称匹配度。实例实验表明,该算法具有较好的适用性和准确性。Character data matching is an important way to improve the quality in data cleansing. For the problem of Chinese short term matching,based on the analysis of existing Chinese matching algorithm,a new matching algorithm is proposed based on database each attributes associated degree. Abbreviated matching degree is counted by the associated attribute comparison similarity in which Chinese abbreviated term is confident in accordance with the amount of data of Chinese abbreviated and full name.

关 键 词:数据清洗 数据挖掘 关联度 中文简称匹配 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象