基于LSI和词典的文本语义相似度算法被引量：1

Based on LSI and Dictionary Text Semantic Similarity Algorithm

出　　处：《煤炭技术》2010年第12期217-218,共2页Coal Technology

摘　　要：在文本聚类领域里普遍存在一种问题,文本的概念相似度却被忽略。文中利用基于词典和基于文集的本体解决这种问题。还提出一种能合适地抓住相关语义相似度的修改过的隐含语义索引模型。实验结果表明该方法要优于惯用的文本语义相似度算法。The common problem in the fields of text clustering is that the conceptual similarity is ignored.We take thesaurus-based and corpus-based ontology to overcome this problem.A transformed latent semantic indexing（LSI） model which can appropriately capture the associated semantic similarity is proposed and demonstrated as corpus-based ontology.Experiments results show that the method apparently outperforms that with traditional similarity measures.

关键词：本体语义相似度隐含语义索引

分类号：TP311[自动化与计算机技术—计算机软件与理论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于LSI和词典的文本语义相似度算法被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于LSI和词典的文本语义相似度算法 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于LSI和词典的文本语义相似度算法被引量：1