基于Web挖掘的商业信息抽取研究  

The Study of Web Business Information Extraction Based on Regular Expressions

在线阅读下载全文

作  者:廖开际[1] 易聪[1] 

机构地区:[1]华南理工大学工商管理学院,广州510640

出  处:《情报杂志》2010年第5期159-162,共4页Journal of Intelligence

基  金:国家自然科学基金"基于服务管理的移动知识管理模型研究"(编号:70871043);广东省自然科学基金"移动知识管理中的上下文感知信息处理研究"(编号:7300831)

摘  要:Web商业信息普遍存在互联网HTML文件中,使用传统手工方法来收集这些信息存在很大的局限性,针对Web上存在的大量商业信息,基于Web挖掘技术,提出了使用正则表达式来收集大规模Web商业信息。实现方式是首先获取网页源文件,接着使用设计好的正则表达式对源文件进行编译,从而抽取其中的Web商业信息。实验表明,这种方法抽取的准确率达到93%以上。

关 键 词:Web商业信息抽取 正则表达式 WEB挖掘 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象