基于XML半结构化的Web网页信息提取研究  被引量:1

在线阅读下载全文

作  者:姜欣 杨国军 

出  处:《网络安全技术与应用》2015年第10期59-60,共2页Network Security Technology & Application

摘  要:0引言 Web信息提取(Web Information Extraction,简称为Web IE)是将Web作为信息源的一类信息进行提取。它的主要目的是从半结构或无结构的信息中提取出特定的事实信息(Factual Information)。比如,从新闻报道中提取出恐怖事件的详细情况:时间、地点、作案者、受害者、袭击目标、使用的武器等;从经济新闻中提取出公司发布新产品的情况:公司名、产品名、发布时间、产品性能等;从病人的医疗记录中提取出症状、诊断记录、检验结果、处方等,或者直接提取文章中某句话或某段话的信息等等。

关 键 词:网页信息 WEB网页 XML 袭击目标 作案者 提取规则 事实信息 无结构 一类信息 新闻报道 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术] TP391.1[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象