基于词关联度的语义相关度算法研究  被引量:1

Research of Semantic Computation Algorithm Based on Word Relativity

在线阅读下载全文

作  者:张增杰[1] 李晓城[1] 刘鑫[1] 夏勇明[1] 钱松荣[1] 

机构地区:[1]复旦大学通信科学与工程系 复旦大学信息科学与工程学院

出  处:《微型电脑应用》2011年第3期45-47,51+6,共5页Microcomputer Applications

摘  要:如今网页排名算法很多,基本上可以分为两类:基于超链接和基于内容。比较成熟的算法主要有PageRank、HITS、LSI等。本文基于向量空间模型以及信息论,提出一个与文章内容相关的语义相关度算法模型。该模型将文章语义抽象为词频表,并通过机器学习构建词语之间的关联度表,以此词关联度为基础,计算文章之间的相关度。实验结果表明,文中提出的相关度算法可以有效的根据文章之间语义相关度大小来进行排名。Now page rank algorithm had been well studied, basically can be divided into two categories: Hyperlink-based and content-based. There are more sophisticated algorithm PageRank, HITS, LSI and so on. Based on vector space model, and information theory, the article proposed a content-related semantic relevance algorithm model. This model calculates the relevance between articles based on the word correlation. Experimental results show that the proposed correlation algorithm can efficiently rank files according...

关 键 词:词关联度 语义 相关度 向量模型 信息量 概率模型 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象