国家重点基础研究发展计划(G1999032706)

作品数:28被引量:400H指数:12
导出分析报告
相关作者:李晓明王继民单松巍冯是聪彭波更多>>
相关机构:北京大学中国科学院新加坡国立大学清华大学更多>>
相关期刊:《北京大学学报(自然科学版)》《华南理工大学学报(自然科学版)》《计算机工程与应用》《电子学报》更多>>
相关主题:搜索引擎信息检索中文网页分类天网PETRI网更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
64位虚拟机SPANVM的设计与实现被引量:2
《计算机工程与科学》2007年第2期139-141,共3页刘黎明 王昭顺 
国家973计划资助项目(G1999032706)
跨平台软件开发和多语言程序设计是当前软件开发中的两个难题,SPANVM是一个基于寄存器和堆栈混合模型的64位运行时系统,凡是符合SPANVM规范的可执行字节码文件都能在移植了该虚拟机的平台上执行。本文介绍了如何设计一个实用的虚拟机系...
关键词:虚拟机 运行时 内存管理 处理器 
一个实用的针对URL的哈希函数被引量:3
《小型微型计算机系统》2006年第3期538-541,共4页肖明忠 闵博楠 王佳聪 代亚非 
国家"九七三"项目(G1999032706)资助;北大"九八五"项目资助.
在Web信息处理的研究中,不少情况下需要对很大的URL序列进行散列(hashing)操作.本文提出了一个针对URL数据集合的均匀哈希函数,它是ELFhash函数的变型.通过对天网搜索引擎采集的1亿多个URL集合的抽样实验表明它能有效使得URL集在哈希表...
关键词:URL 哈希函数 ELFhash 均匀分布 MD5 SHA-1 
大规模搜索引擎检索系统框架与实现要点被引量:20
《计算机工程与科学》2006年第3期1-4,共4页彭波 
国家973计划资助项目(G1999032706);教育部博士点基金课题(20030001076)
随着Web规模的不断扩大,搜索引擎正成为因特网上最常用的应用之一。本文以天网搜索为实例,分析了大规模通用型中文搜索引擎检索系统的设计与实现技术。围绕检索效率和检索效果两个方面,本文介绍天网检索系统的集成框架结构和分布式架构...
关键词:搜索引擎 信息检索 天网 
搜索引擎倒排文件的一种分块组织技术被引量:9
《电子学报》2005年第2期358-362,共5页彭波 李晓明 
国家 973计划项目 (No G1 9990 32 70 6) ;教育部博士点基金 (No 2 0 0 30 0 0 1 0 76)
检索效率对大规模信息检索系统至关重要 .本文基于Web搜索应用背景 ,针对用户查询的统计特性 ,提出了一种分块组织倒排文件的方法 .通过建立检索性能模型 ,进行分析和仿真实验 ,结果表明这一方法下的检索算法可以有效的减少检索执行时...
关键词:搜索引擎 信息检索 倒排文件 检索效率 
面向特定领域人机对话模型研究与实现被引量:3
《计算机工程与应用》2004年第26期82-85,100,共5页陈华 韩近强 邓海清 李晓明 
国家973基础研究规划项目:网络环境下海量信息的理论与方法研究(编号:G1999032706)
通用的自然语言的理解技术当前并不是很成熟,但在面向特定领域的自然语言理解还是可能的。论文从特定领域自然语言的特点以及机器理解技术出发,给出一种适用于特定领域的自然语言理解技术。这种自然语言理解技术结合语音识别和语音合成...
关键词:特定领域 自然语言理解 自然语音合成 人机对话 
搜索引擎用户访问量模型被引量:12
《计算机工程与应用》2004年第25期9-11,30,共4页王继民 彭波 
国家973重点基础发展研究计划项目(编号:G1999032706)资助
基于大规模分布式WWW搜索引擎系统---北大“天网”的用户日志,该文研究了搜索引擎用户访问量建模分析和预测的一般方法;将用户的访问量看成按时间次序排列的随机变量序列,利用时间序列分析的方法,分别建立了天网用户的查询量、点击量和...
关键词:搜索引擎 用户访问量 小波 潜周期模型 
基于流媒体文件字节有用性的代理服务器缓存替代策略被引量:17
《计算机学报》2004年第12期1633-1641,共9页肖明忠 李晓明 刘翰宇 代亚非 张进宇 
国家自然科学基金 ( 90 482 0 0 1);国家"九七三"重点基础研究发展规划项目基金 (G19990 3 2 70 6)资助
将流媒体文件缓存到离用户最近的代理服务器上 ,能够减少广域网络带宽的消耗 ,减轻服务器的负载压力以及降低用户的始播延迟 ,文章关注代理服务器的缓存替代问题 .通过对问题建立模型并分析后得到替代算法模型 ,提出了流媒体文件字节有...
关键词:流媒体文件 缓存替代策略 字节有用性 代理服务器 
搜索引擎的混合索引技术被引量:6
《计算机工程与应用》2004年第22期16-18,共3页彭波 
国家973重点基础研究规划项目(编号:G1999032706);教育部博士点基金课题(编号:20030001076)资助
倒排文件是搜索引擎检索系统普遍采用的索引技术。针对中文搜索引擎中采用自动分词的全文检索因分词词典规模小导致的检索效率下降与词典规模扩大导致检索效果下降的矛盾,论文在天网搜索引擎的实践基础上,提出了一种基于倒排文件实现的...
关键词:搜索引擎 信息检索 倒排索引 
一种中文网页自动分类方法的实现及应用被引量:15
《计算机工程》2004年第5期19-20,108,共3页冯是聪 张志刚 李晓明 
国家"973"计划重大基础研究项目(G1999032706)
为了有效地组织和分析海量的Web信息,文章应用有指导的机器学习方法实现了一个中文网页分类器,并应用该分类器在“天网”搜索引擎上实现了大规模中文网页的目录导航服务。实验结果表明该分类器有较高的分类质量,满足了中文网页自动...
关键词:机器学习 中文网页分类 特征选取 目录导航 
Bloom Filter及其应用综述被引量:31
《计算机科学》2004年第4期180-183,共4页肖明忠 代亚非 
国家重点基础研究发展规划973资助项目(G1999032706);国家863高科技发展计划资助项目(2001AA111013)
Bloom Filter对数据集合采用一个位串表示并能有效支持集合元素的哈希查找操作。本文对Bloom Filter及其改进型进行了综述性分析研究,探讨了它的实用性。较为详细地阐述了它在P2P网络文件存储系统OceanStore和文本检索系统中的应用情况...
关键词:BLOOM FILTER 数据集合 文本检索系统 应用程序 计算机 
检索报告 对象比较 聚类工具 使用帮助 返回顶部