郝亚南

作品数:6被引量:33H指数:3
导出分析报告
供职机构:河北大学数学与计算机学院更多>>
发文主题:WEB信息抽取HTMLXML抽取规则数据格式转换更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《计算机系统应用》《计算机工程》《河北大学学报(自然科学版)》更多>>
所获基金:河北省教育厅科研基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-6
视图:
排序:
基于XML的信息检索技术被引量:3
《微机发展》2005年第1期107-109,共3页李驰 袁方 郝亚南 
河北省教育厅科研计划项目(2001206)
传统的信息检索方法无法为用户准确地提供所需的资料,这主要是由于传统的HTML网页结构上的缺陷造成的。文中通过比较HTML文档和XML文档在结构和语义上的差异,阐述了XML文档在信息检索技术中的优势和XML文档必将成为新一代网页模式的趋...
关键词:超文本标记语言 可扩展标记语言 信息检索 
基于语义的数据格式转换被引量:5
《计算机系统应用》2004年第11期40-43,共4页郝亚南 陈少飞 李天柱 袁方 
本文提出了一种基于语义的数据格式转换方法。该方法以Word文档为例,采用基于学习的策略,自动地将Word文档转换为具有语义信息的XML文档,便于用户对大量Word文档进行精确的基于语义的查询和管理;该方法支持所见即所得,易于使用。
关键词:数据格式转换 WORD文档 XML文档 所见即所得 转换方法 语义信息 文档转换 查询 
基于文档结构的信息抽取规则的描述语言比较研究
《河北大学学报(自然科学版)》2004年第2期212-218,共7页张志强 李天柱 张波 陈少飞 郝亚南 
基于文档结构的信息抽取工具很多 ,XWrap ,W 4F ,Lixto以及自主开发的PQagent是其中比较有代表性的几个 .这几个工具采用了不同的规则描述形式 ,XWrap ,W 4F ,Lixto使用的是自定义的规则描述形式 ,PQagent采用了通用的规范XQuery来描述...
关键词:信息抽取 抽取规则 描述语言 XQUERY 
基于XPath的Web信息抽取的设计与实现被引量:6
《计算机工程》2003年第16期82-83,113,共3页杨文柱 徐林昊 陈少飞 郝亚南 李天柱 
提出了一种基于XPath的Web信息抽取方法,鉴于目前还没有免费的商用XPath引擎可用,于是利用DOM定制了一个XPath引擎,实现了Web信息抽取。该文着重介绍了原型系统的工作原理和实现中所采用的具体技术,该方法可用于Web查询和包装器的...
关键词:XPATH WEB信息抽取 文档对象模型 
数据交换中的数据格式转换被引量:1
《河北大学学报(自然科学版)》2003年第2期215-220,共6页郝亚南 陈少飞 李天柱 
随着Web应用的迅速发展 ,如何进行Web上各系统之间的数据交换成为一个十分重要的问题 .其中的核心是Web上的各种数据格式之间的相互转换 .本文以XML作为数据交换的中介 ,从语法和语义 2个角度出发 ,分析和比较了现有Web上的HTML ,Word及...
关键词:格式交换 XML HTML WORD PDF 语法 语义 
Web信息抽取技术研究进展被引量:19
《河北大学学报(自然科学版)》2003年第1期106-112,共7页陈少飞 郝亚南 李天柱 徐林昊 杨文柱 
Web信息抽取技术是当今的一个研究热点。目前出现了基于不同原理的多种信息抽取技术,它们具有不同的性能。本文根据信息抽取的原理,对现有的信息抽取技术进行了分类,结合典型的系统,在语义的附加方式、模式的定义方式、规则的表现形式...
关键词:WEB信息抽取技术 研究进展 HTML XML 语义 抽取模式 抽取原理 WEB查询 抽取规则 
检索报告 对象比较 聚类工具 使用帮助 返回顶部