孙高尚

作品数:2被引量:4H指数:1
导出分析报告
供职机构:东北大学信息科学与工程学院更多>>
发文主题:DEEP_WEBRECORDSDUPLICATE页面识别方法更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《小型微型计算机系统》《Journal of Southeast University(English Edition)》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
一种应用于Deep Web结果页面中分页标签的识别方法
《小型微型计算机系统》2010年第4期635-640,共6页孙高尚 申德荣 于戈 聂铁铮 寇月 
国家自然科学基金项目(60673139)资助;国家"八六三"高技术研究发展计划项目(2008AA01Z146)资助
针对识别分页标签的必要性,提出二种Deep Web结果页面中分页标签识别模型GL(Global Base on Link)和CSL(Commix Baseon Structure and Link).GL是将一个页面的所有超链接Link都抽取出来,然后根据链接探测得到响应页面,分析响应页面的特...
关键词:分页标签 结果抽取 深层Web 
Duplicate identification model for deep web被引量:4
《Journal of Southeast University(English Edition)》2008年第3期315-317,共3页刘丽楠 寇月 孙高尚 申德荣 于戈 
The National Natural Science Foundation of China(No.60673139)
A duplicate identification model is presented to deal with semi-structured or unstructured data extracted from multiple data sources in the deep web.First,the extracted data is generated to the entity records in the d...
关键词:duplicate records deep web data cleaning semi-structured data 
检索报告 对象比较 聚类工具 使用帮助 返回顶部