正则表达式在油价事件网页提取中的应用  被引量:1

The Application of Regular Expressions in Online Oil Price Event Extraction

在线阅读下载全文

作  者:邵增荣[1] 李英[1] 范体军[1] 

机构地区:[1]华东理工大学商学院,上海200237

出  处:《现代图书情报技术》2009年第2期83-88,共6页New Technology of Library and Information Service

基  金:"十一五"国家科技支撑计划项目"国外矿产资源开发利用风险评价技术研究"(项目编号:2006BAB08B01)的研究成果之一

摘  要:利用正则表达式在字符串操作上的优势,实现从不规则含噪页面中对油价事件信息的抓取,指出实现中的难点要点,并验证正则表达式在字符串处理中强大的结构描述能力。With the advantages of regular expression in string manipulation, this paper realizes extraction of oil price information from noisy and irregular Webpages. Points of importance and difficulty in realization are pointed out, and the structural description ability of regular expression in string manipulation is testified.

关 键 词:正则表达式 网页数据抓取 数据清洗 字符串处理 

分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象