孟涛

作品数:9被引量:49H指数:4
导出分析报告
供职机构:北京大学信息科学技术学院更多>>
发文主题:搜索引擎用户日志权值计算系统模型搜索引擎日志更多>>
发文领域:自动化与计算机技术建筑科学理学文化科学更多>>
发文期刊:《清华大学学报(自然科学版)》《华南理工大学学报(自然科学版)》《电子学报》《北京邮电大学学报》更多>>
所获基金:国家自然科学基金国家教育部博士点基金中国博士后科学基金国家教育部“985工程”更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-9
视图:
排序:
Web搜索引擎日志挖掘研究框架被引量:4
《数字图书馆论坛》2011年第8期25-31,共7页王继民 李雷明子 孟涛 
本研究得到国家社会科学基金(10BTQ050)、教育部人文社会科学基金(09YJA870002)和核高基项目(2011ZX01042-001-001)的资助.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研...
关键词:搜索引擎 用户日志 WEB使用挖掘 用户搜索行为 
中文Web查询演化的主要趋势被引量:1
《情报学报》2007年第4期515-521,共7页王继民 孟涛 
国家自然科学基金资助项目(60573166).
为发现中文Web用户查询行为的演化趋势,本文对近5年的中文天网搜索引擎的用户日志进行了抽样分析.结果显示:用户输入的查询串中所包含词项数量有明显增多的趋势;用户会话的长度逐年下降;用户查看的结果页面越来越少;查看的时间间隔逐...
关键词:搜索引擎 用户日志 演化趋势 
多任务中文Web查询分析被引量:1
《计算机工程》2006年第14期25-26,68,共3页王继民 龚笔宏 孟涛 
国家自然科学基金资助重点项目(60435020);教育部博士点基金(20030001076);中国博士后科学基金(2004036182)
用户在使用Web搜索引擎进行信息查询时,可能包含单个或多个主题。该文针对大规模中文搜索引擎系统——北大天网的多任务Web查询,进行了研究和分析。结果显示:多于1/3的用户进行多任务Web查询;超过1/2的多任务会话包含2个不同的主题并...
关键词:搜索引擎 中文Web查询 多任务 关联规则 
利用支持向量回归确定相关Web查询被引量:1
《华南理工大学学报(自然科学版)》2006年第6期74-78,94,共6页王继民 彭波 孟涛 
国家自然科学基金资助项目(60573166);国家自然科学基金重点资助项目(60435020)
对用户输入的查询请求,如果搜索引擎系统能给出一个相关查询列表,将有助于用户进行查询修正,进而检索到用户所需要的信息.文中提出了一种利用支持向量回归确定相关W eb查询的新方法.对一个给定的W eb查询,首先从用户的使用记录中抽取候...
关键词:搜索引擎 用户日志 相关Web查询 支持向量回归 
网页变化与增量搜集技术被引量:22
《软件学报》2006年第5期1051-1067,共17页孟涛 王继民 闫宏飞 
国家自然科学基金;国家教育部博士点基金~~
互联网络中信息量的快速增长使得增量搜集技术成为网上信息获取的一种有效手段,它可以避免因重复搜集未曾变化的网页而带来的时间和资源上的浪费.网页变化规律的发现和利用是增量搜集技术的一个关键.它用来预测网页的下次变化时间甚至...
关键词:网页变化 增量搜集 调度策略 研究进展 
一个增量搜集中国W eb的系统模型及其实现被引量:7
《清华大学学报(自然科学版)》2005年第S1期1882-1886,共5页孟涛 闫宏飞 王继民 
国家自然科学基金重点资助项目(60435020);教育部博士点基金项目(20030001076)
针对中国W eb的高效增量搜集,设计试验考察了网页的短期变化规律,估算出增量搜集需要的最小搜集能力。提出一个通用的增量式搜集系统模型和它的性能准则,该模型阐明了增量搜集的运行原理。针对该模型,结合北大天网增量搜集系统的开发经...
关键词:增量式 网页搜集 系统模型 中国Web 实现策略 
Web网页信息变化的时间局部性规律及其验证被引量:8
《情报学报》2005年第4期398-406,共9页孟涛 闫宏飞 王继民 
国家自然科学基金,国家重点基础研究发展计划(973计划),高等学校博士学科点专项科研项目
掌握Web网页信息变化的时间规律可以更有针对性的指导搜索引擎等Web应用系统更有效地进行搜集.本文旨在研究中国范围内Web网页变化的时间规律,针对网页变化的频率和间隔两项指标,随机选取数百万网页作为样本,设计试验在一个月内对上述...
关键词:WEB网页 时间局部性 堆栈距离模型 变化次数 变化间隔 时间规律 局部性 信息 验证 应用系统 
基于搜索引擎日志发现相近Web查询被引量:4
《北京邮电大学学报》2005年第z1期44-48,共5页王继民 彭波 孟涛 
国家自然科学基金项目(60435020);教育部博士点基金项目(20030001076);中国博士后科学基金项目(2004036182)
提出了一种利用搜索引擎日志发现高质量相近Web查询的新方法.对一个给定的查询,从日志中抽取候选查询的一些量化指标,如被查询的不同用户量、被查询的次数、用户在反馈结果中的点击次数、与给定查询间的共有词项个数、点击相同URL的个...
关键词:搜索引擎 用户日志 相近Web查询 回归模型 
一种评价搜索引擎信息覆盖率的模型及其验证被引量:5
《电子学报》2003年第8期1168-1172,共5页孟涛 闫宏飞 李晓明 
国家重点基础研究发展规划 (973)项目 (No G1 9990 32 70 6);北京大学 985项目
搜索引擎的网页搜集子系统通常以WWW的网页构成的有向图结构为依据 ,循着网页间的链接进行搜集从而扩大信息覆盖面 .本文针对这种信息覆盖能力 ,建立量化模型从多个角度考察搜集系统对WWW信息资源的覆盖程度 .文章首先分析了网页搜集不...
关键词:搜索引擎 信息覆盖率 采样 权值计算 验证 数量覆盖率 质量覆盖率 
检索报告 对象比较 聚类工具 使用帮助 返回顶部