孙斌

作品数:14被引量:204H指数:7
导出分析报告
供职机构:北京大学更多>>
发文主题:信息提取信息检索信息提取技术面向对象相关度更多>>
发文领域:自动化与计算机技术文化科学经济管理语言文字更多>>
发文期刊:《科学技术与工程》《山东大学学报(理学版)》《中文信息学报》《计算机学报》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于链接聚类的Shark-Search算法被引量:8
《山东大学学报(理学版)》2006年第3期139-143,共5页苏祺 项锟 孙斌 
国家自然科学基金重点项目(60435020);国家自然科学基金项目(60475020)
根据对Shark-Search主题爬取算法的分析,提出了一种基于链接聚类的改进Shark-Search算法.并通过几个对比实验对该算法进行了验证.实验结果表明,新算法能够更有效地识别链接与主题的相关性.
关键词:Shark-Search算法 主题爬取 链接聚类 
检索主题难易度评价
《清华大学学报(自然科学版)》2005年第S1期1833-1837,共5页吕学强 赖治国 孙斌 俞士汶 
国家"八六三"高技术项目(2002AA117010-8);国家自然科学基金资助项目(60203022)
TREC 2004 R obust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列。针对新的要求,提出了基于单词歧义性大小的检索主题难易度模型。根据W ordN et和它附带的B row n语料库构造了单词义项分布词典,再把检索主题中的单词按歧...
关键词:信息检索 文本检索会议 鲁棒性任务 检索主题难易度 义项分布 
搜索引擎用短语词典建设被引量:6
《清华大学学报(自然科学版)》2005年第S1期1892-1895,共4页吕学强 苏祺 孙斌 俞士汶 
国家"八六三"高技术项目(2002AA117010-8);国家自然科学基金资助项目(60203022)
百度搜索引擎分词系统中的原短语库是由统计得出,含有大量噪音。委托北京大学计算语言学研究所进行了手工整理标注。为此设计了加工规范,对短语进行了严格的定义,制定了加工操作手册,并开展了手工工程,通过严格的控制保证标注的一致性...
关键词:搜索引擎 语言资源 短语词典 中文分词 标注 
一种义项矩阵模型SMM被引量:3
《中文信息学报》2005年第2期28-35,共8页孙斌 
国家自然科学基金资助项目 (6 0 4 75 0 2 0 )
本文介绍了一个同时利用词语和义项来索引和检索文档的信息检索模型 ,称为“义项矩阵模型”SMM(SenseMatrixModel) .利用词语和义项的关联提出了一种新的文档表示 ,即把文档表示成为一个term×sense矩阵 ,由此引进或建立起一些很有效用...
关键词:计算机应用 中文信息处理 信息检索 检索模型 义项矩阵 
C^(**)类型约束编程概要
《科学技术与工程》2005年第2期100-109,112,共11页孙斌 
国家自然科学基金(60203022)资助
对面向对象、泛型程序设计(Generic Programming)进行了较为深入的分析,阐明了各自的目标、技术特征及其优缺点,着重论述了C++语言的一个泛型编程扩充语言C如何通过一种叫做"命名类型约束"的新的机制来实现静态类型需求的直接语言支持...
关键词:面向对象 泛型程序设计 类型约束编程 
面向对象、泛型程序设计与类型约束检查被引量:16
《计算机学报》2004年第11期1492-1504,共13页孙斌 
国家自然科学基金项目 (60 2 0 3 0 2 2 ) (泛型程序设计方法;语言和泛型程序库研究 )资助 .
该文对面向对象和泛型程序设计 (genericprogramming)的核心思想和方法进行了较为深入的分析 ,阐明了各自的目标、技术特征及其优缺点所在 ,介绍了泛型程序设计针对对象技术的不足所引进的重大革新 ,即通过类型需求抽象来设计通用、高...
关键词:面向对象 泛型程序设计 需求检查 类型约束 程序设计 
甄别商贸兴衰信息的特征词汇初探被引量:1
《术语标准化与信息技术》2004年第1期27-30,共4页昝红英 孙斌 俞士汶 
根据不同的需求目标,人们经常需要得到网上有关公司/企业的兴衰信息。本文的目标在于研究和发现商贸兴衰信息的词汇或短语的特征,为商贸网页的评价提供基础性资源。
关键词:特征词汇 兴衰信息 网络技术 商贸领域 现代汉语 
名人网页的相关度评价被引量:9
《中文信息学报》2003年第5期27-33,共7页昝红英 苏玉梅 孙斌 俞士汶 
国家自然科学基金资助项目(69973005);863资助项目(2001AA14040);北大-IBM创新研究院资助项目
本文介绍了北京大学天网知名度系统的设计与开发工作,重点论述了中文名人网页相关度评价的因素、算法和相应的检索结果。针对目前搜索引擎服务的不足之处,该工作旨在改进网上信息服务的质量,提高个性化网上信息服务的能力。本系统在北...
关键词:计算机应用 中文信息处理 相关度 检索服务 信息提取 特征信息 
信息提取技术概述(下)被引量:11
《术语标准化与信息技术》2003年第1期34-37,共4页孙斌 
关键词:中文信息提取 汉语命名实体 模式匹配 信息提取技术 
信息提取技术概述(中)被引量:7
《术语标准化与信息技术》2002年第4期30-33,共4页孙斌 
关键词:信息论 信息处理 信道标注 隐MARKOV模型 信息提取技术 
检索报告 对象比较 聚类工具 使用帮助 返回顶部