王煜

作品数:1被引量:3H指数:1
导出分析报告
供职机构:浙江金融职业学院更多>>
发文主题:面向主题网页采集更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机与数字工程》更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-1
视图:
排序:
面向主题的网页采集系统的设计与研究被引量:3
《计算机与数字工程》2008年第4期78-80,93,共4页王煜 张浩斌 
对面向主题的信息采集技术进行了探索性研究。采用基于DOM的信息抽取技术,建立混合空间模型表示内容和结构特征信息,并通过定义网页间相似性来识别主题页面。较好的处理了Web信息抽取中主题页面识别的问题,实验结果证明了系统的可行性。
关键词:面向主题 混合向量空间模型 相似性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部