Web网站死链检测方法  被引量:2

Website Dead Links Detection Method

在线阅读下载全文

作  者:姚卓 蔡皖东[1] 姚烨[1] 

机构地区:[1]西北工业大学计算机学院,陕西西安710129

出  处:《微电子学与计算机》2012年第12期103-107,111,共6页Microelectronics & Computer

基  金:西北工业大学基础研究基金(JC201149);西北工业大学研究生创业种子基金(Z2012141)

摘  要:网站作为大规模的信息集合体,包含了大量的Web链接.有些Web链接经过一段时间之后,因种种原因而失效或者出现错误,从而形成死链.本文提出一种Web网站死链检测方法.根据Web链接的调度过程,自动获取网站链接信息;根据Web链接的结构特点和网页检索操作,对死链进行分析和检测;针对链接的相互引用问题和用户体验与页面深度的关系,对采集的数据进行预处理.实验结果表明,该方法能有效地提高死链的检测覆盖率和处理效率.For large-scale information collection, Web sites contain considerable links. After a period of time, some web references that for a variety of reasons will not lead to a valid or correct web page, which is called dead link. The paper puts forward a dead link testing method. Achieve link messages automatically according to processes of URL dispatch. Analysis and detect dead links based on structural characteristic of web links and chain of actions needed to retrieve a web page; preprocess data collected before, due to a large number of relevant content links existed in a web page and relationship between user experience and page depth. Experiment results show that the method can improve coverage percentages and processing efficiency of dead links detection effectively.

关 键 词:网站 死链检测 HTTP协议Web链接 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象