基于页面内容和链接结构的超链接主题预测算法  被引量:1

The Algorithm of Forecasting URL - Topic Based on Web Structure and Web Page Contents

在线阅读下载全文

作  者:刘红[1] 邵晓良[1] 胡吉兵[1] 

机构地区:[1]解放军第二军医大学网络信息中心,上海200433

出  处:《现代图书情报技术》2005年第5期41-45,共5页New Technology of Library and Information Service

摘  要:主要介绍了设计开发Web主题信息采集系统的一个核心算法——超链接主题预测算法。文章在已有理论的基础上,通过实验分析,发现超链接的主题主要取决于三个因素:父网页的主题相关度、锚文本的主题相关度和Web子图的链接结构特性,从而提出了基于Web页面内容和链接结构的超链接主题预测算法, 系统评价结果显示该算法有很好的效果。This paper introduces primarily a core Algorithm of Web topic information gathering system that we designed--the Forecast URL - Topic Algorithm. It bases on the related theories, analyzes the experiment data and discovers the topic of the hyperlink be decided by three factors primarily: the topic Similarity of the parent Web page, the topic Similarity of the (ex - ) anchor text and the structure characteristic of Web graph, then puts forward the algorithm of Forecasting URL - Topic based on Web structure and Web page contents, the system evaluation result shows that the algorithm has great efficiency.

关 键 词:WEB结构 超链接 主题 预测 算法 

分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象