基于机器学习的Web链接的抽取  被引量:2

Web Linkage Extraction Based on Machine Learning

在线阅读下载全文

作  者:朱红灿[1] 邹凯[1] 

机构地区:[1]湘潭大学管理学院,湖南湘潭411105

出  处:《情报理论与实践》2007年第2期252-255,共4页Information Studies:Theory & Application

摘  要:互联网网页是通过超链接连接起来的,为人们的日常生活和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域发挥着越来越重要的作用。然而存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种有监督机器学习方法自动地抽取网页中的相关链接。试验结果表明该算法具有实用的价值。The hyperlinked Web pages on the Internet provide very rich information resources for daily life and commercial use. The Web linkage analysis is playing a more and more important role in the researches on the World Wide Web. However, there are a lot of linkages irrelative to topics, which lead to topic drift. In this paper, a new method of Web linkage extraction is proposed by analyzing the features of the linkage anchors as supervised machine learning task. The experiment shows that this algorithm is of practical value.

关 键 词:机器学习 链接抽取 主题漂移 贝叶斯算法 

分 类 号:G354[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象