检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张增杰[1] 李晓城[1] 刘鑫[1] 夏勇明[1] 钱松荣[1]
机构地区:[1]复旦大学通信科学与工程系 复旦大学信息科学与工程学院
出 处:《微型电脑应用》2011年第3期45-47,51+6,共5页Microcomputer Applications
摘 要:如今网页排名算法很多,基本上可以分为两类:基于超链接和基于内容。比较成熟的算法主要有PageRank、HITS、LSI等。本文基于向量空间模型以及信息论,提出一个与文章内容相关的语义相关度算法模型。该模型将文章语义抽象为词频表,并通过机器学习构建词语之间的关联度表,以此词关联度为基础,计算文章之间的相关度。实验结果表明,文中提出的相关度算法可以有效的根据文章之间语义相关度大小来进行排名。Now page rank algorithm had been well studied, basically can be divided into two categories: Hyperlink-based and content-based. There are more sophisticated algorithm PageRank, HITS, LSI and so on. Based on vector space model, and information theory, the article proposed a content-related semantic relevance algorithm model. This model calculates the relevance between articles based on the word correlation. Experimental results show that the proposed correlation algorithm can efficiently rank files according...
关 键 词:词关联度 语义 相关度 向量模型 信息量 概率模型
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28