基于信息内容的词林词语相似度计算  被引量:22

IC-based approach for calculating word semantic similarity in CiLin

在线阅读下载全文

作  者:彭琦 朱新华[2] 陈意山[3] 孙柳[2] 李飞[2] 

机构地区:[1]广西师范大学网络信息中心,广西桂林541004 [2]广西师范大学计算机科学与信息工程学院,广西桂林541004 [3]广西师范大学漓江学院,广西桂林541004

出  处:《计算机应用研究》2018年第2期400-404,共5页Application Research of Computers

基  金:国家自然科学基金资助项目(61363036;61462010);广西师范大学自然科学青年基金项目

摘  要:针对哈尔滨工业大学《同义词词林》扩展版的层次结构不能有效反映词语之间信息内容含量差异性的问题进行了研究,进行了《同义词词林》作为词语相似度计算本体的结构改造,增加了原编码信息节点的语义,提出了一种较为适合改造后本体的相似度计算策略。经实验证明,修改后的本体更能体现词语在本体中信息内容含量的差异性,提出的相似度计算策略应用在改进后的本体上时,得出的相似度计算结果准确程度达到了较高水平,具有较好的实用价值。This paper resolved the problem that the hierarchical structure of CiLin provided by HIT ( Harbin Institute of Tech- nology) could not effectively reflect the difference of information content among the words, extracted a word for a node that only has the encoding, optimized the structure of CiLih, and proposed a semantic similarity computing strategy. The experimental resuits show that the optimized CiLin can better reflect the difference among the words. The proposed new strategy is applied to the optimized CiLin, the accuracy of the calculation results reach a high level, and has good practical value.

关 键 词:词林 词语相似度 信息内容 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象