基于文本空间表示模型的文本相似度计算研究  被引量:4

Using Text Space Representation Model in Text Similarity Computing

在线阅读下载全文

作  者:张文萍[1] 黎春兰[2] 

机构地区:[1]武汉科技大学管理学院,湖北武汉430081 [2]武汉大学信息管理学院,湖北武汉430072

出  处:《现代情报》2013年第2期21-23,124,共4页Journal of Modern Information

基  金:湖北省教育厅人文社科项目"云计算环境下图书馆信息服务模型研究"(2012Q190)研究成果之一

摘  要:在分析现有文本表示法的基础之处,提出一种以段落、语句、词语为层次结构的文本表示方法———文本空间表示模型,并在此模型基础上探讨一种以文本段落为基本单位的相似文本计算算法,以实现相似文本检测目标。最后建立测试集并在测试集上执行检测实验,结果表明此方具有较好的相似文本发现效果。Based on the analysis of existing text representation methods, a new model for text representation that decompose text to paragraphs, sentences and phrases hierarchically is introduced in this study contrast with the inadequacy of existing text representation methods. With the help of this model we propose a text similarity computing method on the unit of paragraph of text. The following experiments carried on the testing set proved a better effect by this method.

关 键 词:文本相似度 文本空间表示模型 段落 算法 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象