白玉昭

作品数:2被引量:15H指数:2
导出分析报告
供职机构:江南大学物联网工程学院更多>>
发文主题:主题爬虫查询扩展共现分析语义相似度语义词典更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《南京大学学报(自然科学版)》《计算机工程与科学》更多>>
所获基金:国家自然科学基金教育部留学回国人员科研启动基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
一种基于语义词典的局部查询扩展方法被引量:8
《南京大学学报(自然科学版)》2014年第4期526-533,共8页吴秦 白玉昭 梁久祯 
国家自然科学基金(61202312;61170121);教育部留学回国人员科研启动基金
针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩...
关键词:查询扩展 语义词典 共现分析 语义相似度 
基于概率模型的主题爬虫的研究和实现被引量:7
《计算机工程与科学》2013年第1期160-165,共6页白玉昭 梁久祯 
国家自然科学基金资助项目(61170121)
在现有多种主题爬虫的基础上,提出了一种基于概率模型的主题爬虫。它综合抓取过程中获得的多方面的特征信息来进行分析,并运用概率模型计算每个URL的优先值,从而对URL进行过滤和排序。基于概率模型的主题爬虫解决了大多数爬虫抓取策略...
关键词:主题爬虫 概率模型 URL过滤 URL排序 优先值 
检索报告 对象比较 聚类工具 使用帮助 返回顶部