检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京大学计算机研究所文字信息处理技术国家重点实验室,北京100871
出 处:《计算机工程》2001年第10期19-21,113,共4页Computer Engineering
基 金:国家重点工程中国百科术语数据库工程新闻出版署--(上报国家计委的重点工程)
摘 要:提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应用于实际系统中。A model of structure extraction was brought forward in the paper. First, an idea was given that the semantic structure information been extracted at information source through the rules of the relation between semantic structure information and style information. Then, the paper puts forward a model how to extract structure of semi-structured document. The key step and key algorithm were discussed in detail. Last, the extraction method and its application were summarized with an system, which had been constructed based on the scheme. The idea and the method had been used in an applied system with success.
关 键 词:半结构化文档集 结构模式提取 WEB INTERNET
分 类 号:TP393.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13