检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:于春燕[1,2]
机构地区:[1]合肥工业大学计算机与信息学院,安徽合肥230009 [2]滁州学院计算机科学与技术系,安徽滁州239012
出 处:《电脑知识与技术》2007年第11期599-600,共2页Computer Knowledge and Technology
摘 要:根据“行情数据常表现为最大的表格区域”等规律,提出了先识别最大表格再自动抽取行情数据的抽取算法,该算法无需用户定义目标区域即可自动抽取并存储数据。A market data extraction algorithm is proposed in this paper, which is based on the rule of “market data are usually displayed in the largest table on a Web page”. The algorithm first detects the largest table on a Web page and then extracts the data automatically and does not need a data extraction region to be specified by the users.
关 键 词:数据抽取 WEB内容挖掘 行情数据抽取 表格数据抽取
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222