基于超链接分析的网页正文提取方法  被引量:1

Research on Main Text Extraction for Chinese Web Pages Based on Web Hyperlink

在线阅读下载全文

作  者:任翔[1] 刘彬[1] 

机构地区:[1]泰山学院信息科学技术学院,山东泰安271021

出  处:《泰山学院学报》2010年第3期44-48,共5页Journal of Taishan University

摘  要:随着网络的迅猛发展,web服务已经成为研究的热点之一.本文介绍了一种文件类型网页文件的文本信息预处理技术.该方法能够解析网页文件的组成结构,并从中提取出主体文本以供处理.测试表明该方法能快速有效地得到大部分HTML网页的主体部分.With the increase of Internet,web service has been the focus of research.The paper proposes a Chinese web pages preprocessing method.The method can parse web pages,and extract the main part from the web pages.The experiment shows that the method is feasible to parse web pages.

关 键 词:网页正文 WEB服务 超链接 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象