检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《武汉理工大学学报(信息与管理工程版)》2007年第7期96-99,共4页Journal of Wuhan University of Technology:Information & Management Engineering
基 金:国家自然科学基金资助项目(70572079)
摘 要:随着互联网的普及和电子商务的发展,形成了大量的商品供应信息资源。从企业门户网站和电子市场的海量商品网页中抽取出供应信息资源,是电子交易迫切需要解决的问题。在分析信息抽取过程和商品网页结构的基础上,构建了基于网页DOM树的商品供应信息抽取模型。该模型由网页采集层、HTML文档解析层、信息抽取层和结果处理层组成,并重点对信息抽取层的抽取规则进行了探讨。With the development of Internet and electronic commerce, there exists tremendous of product supplying information resources. The crucial problem of electronic trading is the ability to extract useful resources from the huge product pages of enterprises portal and electronic marketplaces. Based on the analysis of information extraction process and the structure of product web page, a product information extraction model based on DOM tree is established. This model is composed by page gathering layer, document parsing layer, information extracting layer and result processing layer. And the extraction rules of information extracting layer is highlighted.
分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.170