半结构化文档

作品数:8被引量:13H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:陈晓鸥杨建武宋强王鲁达张祖平更多>>
相关机构:北京大学清华大学东南大学中南大学更多>>
相关期刊:《计算机与现代化》《计算机工程》《河南大学学报(自然科学版)》《东南大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金高等学校优秀青年教师教学科研奖励计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-8
视图:
排序:
基于Petri网的遥感流程自动形式化建模方法研究
《河南大学学报(自然科学版)》2023年第3期328-339,共12页乔保军 何思源 杜莹 
国家重点研发计划(2019YFE0126600);河南省重大科技专项(201400210300);河南省重点研发与推广专项(科技攻关)项目(212102210079);河南省教改项目(2021SJGLX080);河南大学教改项目(HDXJJG2021-010)
传统遥感数据处理流程分散且独立,缺乏形式化语义模型,更没有通用的遥感数据处理流程自动形式化建模方法,难以进行有效分析和验证,不利于实现计算机对遥感数据处理流程的自动控制.针对以上问题,本文结合Petri网建模的相关研究成果,构建...
关键词:遥感数据处理流程 形式化建模 PETRI网 半结构化文档 
半结构化文档数据流的快速频繁模式挖掘
《东南大学学报(自然科学版)》2006年第3期452-456,共5页赵传申 孙志挥 
国家自然科学基金资助项目(70371015)
为了提高半结构化文档数据流的挖掘效率,对原有挖掘算法StreamT进行了改进,提出了一种半结构化文档数据流的快速频繁模式挖掘算法———FStreamT.该算法针对利用集合存储候选频繁模式效率较低的缺点,采用枚举树存储候选频繁模式,可以有...
关键词:数据挖掘 频繁模式 数据流 枚举树 
半结构化文档中非标记化表格的抽取被引量:3
《计算机工程》2005年第18期81-83,171,共4页宋强 徐鹏 李涓子 
对非标记化表格进行数据建模,利用非标记化表格在文档中的结构分布特征,给出了非标记化表格的抽取算法。对非标记化表格进行行列划分,然后进行标题归纳和单元格合并。实验结果表明,论文提出的算法的正确性令人满意。
关键词:非标记化表格 信息抽取 分层聚类 
半结构化数据与关系数据的比较研究被引量:3
《计算机与现代化》2004年第1期29-30,37,共3页庄毅 徐海力 
围绕将半结构化数据(XML)与关系数据的比较及两者在性能上问题,进行了一些讨论。并通过一个试验程序,具体考察了半结构化数据和关系数据在处理较大规模数据(1万条记录以上)时性能上的差异。最后,对于其在这个领域内的应用,给出了一些探...
关键词:半结构化数据 关系数据 半结构化文档 数据库 计算机 
数字图书馆中基于XML的搜索引擎设计被引量:1
《情报科学》2003年第12期1320-1322,共3页韩毅 
数字图书馆在 WWW上进行相应的信息展示与提供 ,基于 HTML 的文档标记使信息查寻遇到了很大的挑战。本文提出了基于 XML 的搜索引擎逻辑结构 ,并对其中的关键技术进行了研究 ,提出了对 XML半结构化文档建立索引和查寻时采用的数据结构...
关键词:数字图书馆 XML 搜索引擎 HTML 半结构化文档 网络信息检索 信息组织 
基于XML的档案袋数据管理技术初探
《五邑大学学报(自然科学版)》2003年第2期47-53,共7页李庆 刘智勇 
对档案袋数据管理技术(APDM)体系结构的建立、层次文档的形成和管理关键性技术进行了研究,提出了针对这种半结构化文档的存储方法和索引策略。
关键词:档案袋数据管理系统 体系结构 信息管理 XML 半结构化文档 层次文档 数据库 
XML数据库的并行RPE查询被引量:1
《计算机科学》2003年第3期120-122,共3页胡军安 于亚新 王国仁 于戈 
高等学校优秀青年教师教学科研奖励计划;国家自然科学基金(60173051)
Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of ...
关键词:XML 数据库 并行RPE查询 数据查询 数据模型 半结构化文档 
半结构化文档集的结构模式提取的研究与实现被引量:5
《计算机工程》2001年第10期19-21,113,共4页杨建武 陈晓鸥 
国家重点工程中国百科术语数据库工程新闻出版署--(上报国家计委的重点工程)
提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应...
关键词:半结构化文档集 结构模式提取 WEB INTERNET 
检索报告 对象比较 聚类工具 使用帮助 返回顶部