王强

作品数:4被引量:13H指数:2
导出分析报告
供职机构:南京大学计算机科学与技术系更多>>
发文主题:WEBINTERNETHTML解析器法器XPATH更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机应用研究》《计算机研究与发展》《中文信息学报》更多>>
所获基金:国家自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
Web图像清洗技术的研究与实现被引量:1
《计算机研究与发展》2002年第11期1484-1490,共7页张波 王继成 王强 张福炎 
国家自然科学基金 ( 6 0 0 730 30 );日本富士通研究所"Web文档清洗技术研究"项目资助
目前 Web文档中充斥着各种图像 ,因此 ,对 Web上的图像进行清洗就显得非常必要 .提出了 Web图像清洗的概念 ,给出了一种基于机器学习的 Web图像清洗方案 ,并实现了基于此方案的系统 .将图像特征的提取建立在 Web文档的 DOM结构之上 ,并...
关键词:WEB 图像清洗 机器学习 特征提取 决策树 图像处理 图像过滤 
Web文档清洗系统中HTML解析器的开发被引量:7
《计算机应用研究》2002年第2期54-57,共4页王强 王继成 武港山 张福炎 
国家自然科学基金资助项目 (60 0 73 0 3 0 );国家教育部"现代远程教育关键技术研究重点项目" ;日本富士通研究所"Web文档清洗技术研究"资助项目
对于组建一个面向Web的信息系统来说 ,去除掉脚本、广告链接以及导航链接等无用数据 ,将提高信息存储和检索的效率 ;同时 ,基于语义对Web文档进行合并和分割也会有助于信息的管理 ,这些都是Web文档清洗系统的任务。在Web文档清洗中 ,无...
关键词:HTML解析器 词法器 递归下降 文档清洗系统 WEB INTERNET 
对XPath模式定位能力的扩充被引量:4
《计算机研究与发展》2001年第6期674-678,共5页王强 武港山 
国家自然科学基金资助!(60 0 73 0 3 0 )
基于一般结构模式的定位手段对一个完备的面向 XML文档内容的定位机制来说是重要的 ,而 XPath在这方面还有所欠缺 .首先通过实例分析阐明了 XPath提供基于一般结构模式的定位手段的必要性 ,随后通过一些扩充定义来改善它的表示能力 .扩...
关键词:结点序列模式 正则表达式 模式匹配 函数 自动机 XPATH 
面向置标文档的文档转换技术研究被引量:1
《中文信息学报》2000年第4期53-58,64,共7页李景春 武港山 王强 张福炎 
江苏省应用基础研究项目 !(BJ95 0 0 6 )
文档系统间的转换是文档内容共享和协作的必然途径 ,转换根据不同应用目的包括失真 ,不失真和增值三种方式。置标文档是用标签 (Tag)进行文档结构描述的文档。本文介绍了一种面向置标文档的文档转换增值技术 ,给出了一种文档转换描述语...
关键词:失真 置标文档 文档转换技术 文档转换描述语言 
检索报告 对象比较 聚类工具 使用帮助 返回顶部