检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]安徽理工大学计算机科学与工程学院,淮南232001 [2]上海大学计算机工程与科学学院,上海200072
出 处:《计算机科学》2009年第9期227-230,共4页Computer Science
基 金:国家自然科学基金(60575035);上海市重点学科建设项目(J50103)资助
摘 要:Web表格的定位作为Web表格抽取的一个重要研究内容,现在越来越得到更多人的重视。根据Web表格的结构标记和自定义的启发式规则,通过对〈TABLE〉嵌套问题的解决、数据表格完整性的判断、〈TABLE〉树的遍历来完成表格的定位。Web table positioning technology is considered as essential components of Web table information extraction, and more and more people pay attention to them. This paper realized table positioning according to Web table structure label and heuristic method rules of user-definition, which includes the solution of (TABLE) nesting problem, the determination of table data's integrality, and traversal of (TABLE) tree.
关 键 词:DOM树 表格定位 启发式规则 〈TABLE〉嵌套 遍历
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.121.205