基于概念相似度的文本相似计算  被引量:17

在线阅读下载全文

作  者:彭京[1,2,3] 杨冬青[1,2] 唐世渭[1,2] 王腾蛟[1,2] 高军[1,2] 

机构地区:[1]北京大学信息科学技术学院,北京100871 [2]高可信软件技术教育部重点实验室,北京100871 [3]成都市公安局科技处,成都610017

出  处:《中国科学(F辑:信息科学)》2009年第5期534-544,共11页

基  金:中国博士后科学基金(批准号:20060400002);四川省青年科技基金(批准号:07ZQ026-55;08ZQ026-016);国家自然科学基金(批准号:60473051;60503037);国家高技术研究发展计划(批准号:2006AA01Z230);北京市自然科学基金(批准号:4062018)资助项目

摘  要:根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1)提出了一种新的词相似度计算公式;2)提出了一种新的基于词相似度的文本相似计算方法;3)成功的将该方法应用到WEB新闻相似查询中;4)通过实验证明算法的有效性.

关 键 词:概念相似度 相似计算 向量空间 内积空间 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象