基于知网与词林的词语语义相似度计算  被引量:64

Word Semantic Similarity Computation Based on HowNet and CiLin

在线阅读下载全文

作  者:朱新华[1] 马润聪 孙柳[1] 陈宏朝[1] ZHU Xinhua MA Runcong SUN Liu CHEN Hongchao(College of Computer Science ~ Information Technology,Guangxi Normal University, Guilin, Guangxi 541004, China)

机构地区:[1]广西师范大学计算机科学与信息工程学院,广西桂林541004

出  处:《中文信息学报》2016年第4期29-36,共8页Journal of Chinese Information Processing

基  金:国家自然科学基金(61363036)

摘  要:该文提出了一种综合知网与同义词词林的词语语义相似度计算方法。知网部分根据义原层次结构的特征,采用了顶部平缓而底部陡峭的曲线单调递减的边权重策略,改进了现有的义原相似度算法;词林部分采用以词语距离为主要因素、分支节点数和分支间隔为微调节参数的方法,改进了现有的词林词语相似度算法。然后再根据词语的分布情况,采用综合考虑知网与同义词林的动态加权策略计算出最终的词语语义相似度。该方法充分利用了词语在知网与词林中的语义信息,极大地扩充了可计算词语的范围,同时也提高了词语相似度计算的准确率。A word semantic similarity computation method based on the HowNet and CiLin is proposed in this paper.First,according to the characteristics of sememe hierarchical structure,an edge weighting strategy of monotonic decreasing curve with flat top and steep bottom is used in the HowNet part.In the CiLin part,a special method of taking the distance between words as the main factor and the branch node quantity and branch interval as micro-adjustable parameters is used.Then,according to the distribution of words,a dynamic weighting strategy of considering both HowNet and CiLin is used to calculate the final similarity,which greatly expands the computable range of words and improves the computation accuracy of word similarity.

关 键 词:语义相似度 知网 同义词词林 语义距离 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象