检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:程晓伟[1] 田东风[1] CHENG Xiao-wei, TIAN Dong-feng (China University of Geoscience, Beijing 100083, China)
机构地区:[1]中国地质大学,北京100083
出 处:《电脑知识与技术》2009年第4期2553-2556,共4页Computer Knowledge and Technology
摘 要:提出了一种基于树及索引结构的HTML解析与表格数据抽取的算法,并对各子算法复杂性进行了讨论,对HTML标签存贮模型及表格数据挖掘模型进行了详细的说明,对算法所涉及的二叉树、栈、容器、递归等算法及数据结构作了清晰阐述。This paper brings forward an algorithm based on tree and index, which is to analyse HTML and dig data of table. The complexity of this algorithm is discussed. The model of storing labels of HTML and that of digging table data are detailed. The data structures such as bi-tree, stack, vector and so on mentioned in the algorithm are showed.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49