基于汉字聚类特征的中文字符串相似度计算研究  被引量:6

Research Towards Chinese String Similarity Based on the Clustering Feature of Chinese Characters

在线阅读下载全文

作  者:王静婷[1] 

机构地区:[1]南京政治学院上海分院军事信息管理系,上海200433

出  处:《现代图书情报技术》2011年第2期48-53,共6页New Technology of Library and Information Service

摘  要:采用聚类分析的方法,对汉字的特征进行研究和分析,找出其内在规律,根据汉字具有"成簇性"的特点,对中文字符串进行精细化匹配,给出基于改进编辑距离的相似度计算模型。实验结果表明,该模型对中文字符串的相似度具有更为精细的体现。This paper adopts cluster analysis method to discuss and analyze the features of Chinese characters,in order to discover the internal rules. Based on the clustering feature of Chinese characters, it refines the matching result of string matching, and advances a 2 - level similarity model. The experiment result shows that this model can reflect the similarity better.

关 键 词:中文字符串匹配 汉字成簇性 相似度 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象