国家自然科学基金(60203007)

作品数:8被引量:38H指数:4
导出分析报告
相关作者:孙乐张俊林孙玉芳李飞李文波更多>>
相关机构:中国科学院软件研究所更多>>
相关期刊:《计算机研究与发展》《中文信息学报》更多>>
相关主题:语言模型中文信息处理人工智能计算机应用信息检索更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-8
视图:
排序:
基于非连续短语的统计翻译模型研究被引量:5
《中文信息学报》2007年第1期101-108,共8页张大鲲 张玮 冯元勇 孙乐 
国家自然科学基金资助项目(60203007)
目前统计机器翻译的主流方法仍然是基于短语的翻译模型。然而,该模型并没有考虑对非连续短语的处理。本文提出了一种基于非连续短语的统计翻译模型,利用该模型可以使翻译的基本单元从连续短语扩展到带有间隔的非连续短语,以更好地解决...
关键词:人工智能 机器翻译 非连续短语 统计机器翻译 短语模型 
重新审视跨语言信息检索被引量:10
《中文信息学报》2006年第4期33-40,共8页闵金明 孙乐 张俊林 
国家自然科学基金资助项目(60203007);国家863高技术研究发展计划资助项目(2003AA1Z2110);北京市科技新星计划资助项目(H020820790130)
阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视...
关键词:计算机应用 中文信息处理 跨语言信息检索 未登录词 词义消歧 多语言信息检索 
基于Web数据的特定领域双语词典抽取被引量:11
《中文信息学报》2006年第2期16-23,共8页张永臣 孙乐 李飞 李文波 西野文人 于浩 方高林 
富士通研究开发中心合作项目;国家自然科学基金资助项目(60203007);国家"八六三"高技术研究发展计划资助项目(2003AA1Z2110);北京市科技新星计划资助项目(H020820790130)
双语词典是跨语言检索以及机器翻译等自然语言处理应用的基础资源。本文提出了一种从非平行语料中抽取特定领域双语词典的算法。首先给出了算法的基本假设并回顾了相关的研究方法,然后详细给出了利用词间关系矩阵法从特定领域非平行语...
关键词:计算机应用 中文信息处理 双语词典 词间关系矩阵 非平行语料 种子词 
DifX:利用动态索引体系实现高效的XML数据查询
《计算机研究与发展》2005年第11期1997-2003,共7页曲卫民 张俊林 孙乐 孙玉芳 
国家"八六三"高技术研究发展计划基金项目(2001AA114040);国家自然科学基金项目(60203007)~~
已有的XML数据索引方法从实现思想上可分为两类:结构归纳法和节点定位法·这两种方法都存在一定的问题,结构归纳法的缺点是索引规模较大而且难以有效支持较复杂的查询,而节点定位法的主要缺点是容易形成过多的连接操作·针对这些问题,...
关键词:XML 索引 动态 
基于主题语言模型的中文信息检索系统研究被引量:4
《中文信息学报》2005年第3期14-20,共7页张俊林 孙乐 孙玉芳 
国家自然科学基金资助项目 (6 0 2 0 30 0 7) ;国家 86 3计划资助项目 (2 0 0 1AA114 0 4 0 )
准确的文档语言模型估计对于改善语言模型检索系统的性能是非常重要的。在本文中我们提出了基于主题语言模型的信息检索系统,首先设计了“改进的两阶段K Means聚类算法”来对文档集合进行聚类,通过引入AspectModel结合聚类结果可以得到...
关键词:人工智能 自然语言处理 主题语言模型 信息检索 
一种改进的基于记忆的自适应汉语语言模型被引量:2
《中文信息学报》2005年第1期8-13,共6页张俊林 孙乐 孙玉芳 
国家自然科学基金资助项目 (6 0 2 0 30 0 7);国家"十五"86 3重大项目资助 (2 0 0 1AA114 0 4 0 )
基于记忆的自适应语言模型虽然在一定程度上增强了语言模型对不同领域的适应性 ,但其假设过于简单 ,即认为一个在文章的前面部分出现过的词往往会在后面重复出现。通过对一些文本的观察分析 ,我们认为作者在书写文章的时候 ,除了常常使...
关键词:人工智能 自然语言处理 语言模型 自适应 同义词词林 困惑度 
一种改善的基于语言模型的中文检索系统研究被引量:3
《中文信息学报》2004年第2期23-29,43,共8页张俊林 曲为民 孙乐 孙玉芳 
国家自然科学基金资助项目 (6 0 2 0 30 0 7) ;国家"十五"86 3重大项目资助 (2 0 0 1AA114 0 4 0 )
最近几年提出的语言模型检索系统将语音识别领域的语言模型技术引入信息检索领域并改善了检索系统的性能 ,但是其隐含的词汇间相互独立的假设并不符合实际情况。尽管统计翻译模型考虑了词汇间的同义词因素 ,但是由于它没有考虑词汇上下...
关键词:计算机应用 中文信息处理 语言模型 信息检索 触发 中文检索系统 
基于主题的汉语语言模型的研究被引量:4
《计算机研究与发展》2003年第9期1368-1374,共7页曲卫民 张俊林 孙乐 
国家自然科学基金 ( 60 2 0 3 0 0 7);国家"八六三"高技术研究发展计划重大项目基金 ( 2 0 0 1AA114 0 40 )
基于主题的自适应语言模型能有效地解决语言模型跨主题应用的问题 ,针对其面临的两个主要问题———语料的分类和各语言模型的融合 ,采用了一种新的语料分类算法 ,突破了原有分类方法的一些局限性 ,并提出了一种改进的融合各语言模型的...
关键词:语言模型 自适应 主题 分类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部