王鹏坡

作品数:1被引量:2H指数:1
导出分析报告
供职机构:解放军电子工程学院网络工程系更多>>
发文主题:页面半结构化信息抽取后缀树粒度分析更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与应用》更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
自动粒度选择的半结构化页面信息抽取被引量:2
《计算机工程与应用》2009年第6期165-167,172,共4页王晓斌 王鹏坡 石昭祥 
半结构化页面的数据记录间存在结构相似性,在先序遍历DOM树生成的标记序列中表现为重复出现的模式,可利用后缀树进行挖掘。由于标记序列可以在块粒度和文本粒度两个级别上展现,而不同粒度下产生的最佳抽取模式在抽取效果方面又表现出不...
关键词:信息抽取 重复模式挖掘 粒度分析 后缀树 
检索报告 对象比较 聚类工具 使用帮助 返回顶部