面向领域的Web信息自动抽取技术研究  

在线阅读下载全文

作  者:陈建彪[1] 

机构地区:[1]新乡学院,新乡河南454000

出  处:《计算机光盘软件与应用》2012年第24期59-60,共2页Computer CD Software and Application

摘  要:本文分析了目前Web数据抽取主流技术,针对领域网站上文本信息采用MDR算法进行抽取,阐述了网页抽取的工作流程,并通过引入文本分类算法提高了网页抽取的查准率。

关 键 词:网页抽取 DOM 面向领域 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象