卓林

作品数:6被引量:9H指数:1
导出分析报告
供职机构:中国人民银行更多>>
发文主题:DEEP_WEBDEEPWEB增量式抽取方法更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机光盘软件与应用》《苏州大学学报(工科版)》《计算机工程》更多>>
所获基金:国家自然科学基金江苏省基础研究计划江苏省重大科技支撑与自主创新项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-6
视图:
排序:
基于本体和语义相似度的Deep Web数据源发现技术
《计算机光盘软件与应用》2012年第20期237-237,259,共2页卓林 
Deep Web数据源发现是指从Web中搜索到含有Web数据库的Deep Web站点。查询接口作为DeepWeb数据源信息访问的唯一入口,发现工作更多地转向了对查询接口的判定。本文在处理时,首先构建领域本体模型,并利用HowNet语义知识辞典进行语义相似...
关键词:DEEP Web本体 语义相似度 启发式规则 
Deep Web爬虫的一种增量式更新策略被引量:1
《苏州大学学报(工科版)》2011年第4期6-10,共5页卓林 杨舟 岳亮 赵朋朋 崔志明 
国家自然科学基金资助项目(编号60970015);2008年江苏省重大科技支撑与自主创新项目(编号BE2008044)
为了在网络及计算机硬件等资源有限的前提下,最大限度地保证本地副本的"新鲜"程度,往往需要为Deep Web爬虫定制一个重爬机制。为了满足这种需求,提出了一种基于采样的增量式Deep Web更新方法,使用贪心策略分配爬虫资源,以最大限地的提...
关键词:DEEP WEB 数据爬虫 增量更新 
一种基于领域本体的Deep Web数据自动标注方法
《苏州大学学报(工科版)》2011年第4期11-15,共5页杨舟 岳亮 卓林 赵朋朋 崔志明 
国家自然科学基金资助项目(编号60970015);2008年江苏省重大科技支撑与自主创新项目(编号BE2008044)
为了准确全面地对Deep Web查询结果页面的数据进行语义标注,将领域本体作为Web数据库所应遵循的全局模式引入到语义标注的研究中,通过建立起接口模式、结果模式与本体间的映射来实现数据的自动语义标注。针对多个不同领域的Web数据库进...
关键词:DEEP WEB 数据标注 本体 模式匹配 
一种面向Deep Web集成服务的查询结果动态排序方法
《苏州大学学报(工科版)》2011年第3期8-12,共5页岳亮 杨舟 卓林 赵朋朋 崔志明 
国家自然科学基金资助项目(编号60970015);2009年江苏省省级现代服务业发展专项引导资金项目(编号[2009]332-64);2008年江苏省重大科技支撑与自主创新项目(编号BE2008044);江苏省基础研究计划企业博士创新项目(编号BK2009563)
Deep Web集成服务的快速发展,方便了用户对Deep Web信息检索需求。如何提高查询结果的排序效果,将最接近用户查询的结果显示给用户,逐渐成为研究重点。提出了一种综合评判方法,从数据源质量、查询相关度以及查询响应反馈三个方面,综合...
关键词:数据源选择 TF-IDF 动态排序 
基于二维混合条件随机场的Web记录抽取模型
《计算机工程》2011年第5期59-61,64,共4页卓林 杨舟 赵朋朋 崔志明 
国家自然科学基金资助项目(60970015);2008年江苏省重大科技支撑与自主创新基金资助项目(BE2008044);江苏省基础研究计划企业博士创新基金资助项目(BK2009563)
提出一种基于混合二维条件随机场的Web记录抽取模型,以克服线性链条件随机场不能充分利用Web实体间二维依赖关系的缺点,且训练条件随机场模型时无需大量手工标注的样本数据。对当当网上的742个数据记录进行抽取,对比同等情况下的其他模...
关键词:条件随机场 混合条件随机场 信息抽取 Web记录 
一种针对商品数据记录的自动抽取方法被引量:8
《计算机工程》2010年第23期262-265,共4页杨舟 卓林 赵朋朋 崔志明 
国家自然科学基金资助项目(60970015);2008年江苏省重大科技支撑与自主创新基金资助项目(BE2008044);江苏省基础研究计划企业博士创新基金资助项目(BK2009563)
提出一种针对电子商务网站商品列表页数据记录的自动抽取方法。该方法根据商品记录的特点,通过商品记录中商品的文本、图片以及布局等节点类型信息计算节点对应的值,依据节点值的相似度对节点进行分组,再从不同分组中过滤出包含数据记...
关键词:WEB信息抽取 数据抽取 信息集成 商品数据记录 
检索报告 对象比较 聚类工具 使用帮助 返回顶部