统计语言模型

作品数:106被引量:473H指数:11
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:黄永文郑方吴文虎何中市荀恩东更多>>
相关机构:清华大学哈尔滨工业大学重庆大学北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划教育部科学技术研究重点项目更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学x
条 记 录,以下是1-7
视图:
排序:
基于方法约束关系的代码预测模型
《计算机科学》2019年第1期219-225,共7页方文渊 刘琰 朱玛 
国家重点研发计划基金(2017YFB0802900)资助
最新的研究表明,从大量源代码中提取代码特征,建立统计语言模型,对代码有着良好的预测能力。然而,现有的统计语言模型在建模时,往往采用代码中的文本信息作为特征词,对代码的语法结构信息利用不充分,预测准确率仍有提升空间。为提高代...
关键词:统计语言模型 方法的约束关系 代码预测 方法调用 
基于关键词的RDF数据图查询模型研究被引量:1
《计算机科学》2015年第7期234-239,249,共7页郑志蕴 刘博 李伦 王振飞 
河南省国际科技合作项目(144300510007)资助
随着语义网数据的海量涌现,人们更加关注RDF图的数据查询效率,通过关键词匹配直接查询RDF数据图成为一个研究热点。针对关键词查询中普遍存在的结果冗余与偏离等问题,提出了一种基于关键词的RDF数据图查询模型。该模型首先采用提出的基...
关键词:RDF数据图 关键词查询 子图 相似度矩阵 统计语言模型 
基于关联规则的自动构词算法研究被引量:3
《计算机科学》2014年第11期256-259,共4页王鉴全 季绍波 
词语是中文文本的基本元素,汉语语言模型在中文文本挖掘中起关键作用。中文文本挖掘是高维度的数据处理技术,挖掘算法对维度的大小比较敏感,因此挖掘效果依赖于词库的质量。另外,现存的汉语语言模型一般都是基于统计的,比如N-gram语言...
关键词:自动构词 统计语言模型 关联规则 最长公共子序列 文本分类 
统计自然语言处理中的线性插值平滑技术被引量:4
《计算机科学》2007年第6期223-225,244,共4页张敬芝 高强 耿桦 潘金贵 
统计自然语言处理中,一个很复杂的问题是数据稀疏问题。主要有两种平滑方法解决:回退法和线性插值法。本文分析和比较了几种典型的线性插值方法,着重研究了它们所引发的词性聚类倾向。在此基础上,给出了2种改进的平滑方法。实验表明,改...
关键词:统计语言模型 数据稀疏问题 平滑技术 回退法 线性插值法 N-GRAM 
基于统计语言模型的信息检索被引量:9
《计算机科学》2005年第8期124-127,共4页李晓光 王大玲 于戈 
国家自然科学基金(No.60173051);教育部高等学校优秀青年教师教学和科研奖励基金
本文对基于统计语言模型的信息检索进行了综述,介绍了目前基于统计语言模型信息检索中比较有代表性的模型,给出了语言模型估计中常用的几种平滑技术,将语言模型同目前流行信息检索模型进行了比较,在此基础上,指出了基于统计语言模型信...
关键词:统计语言模型 信息检索 平滑技术 布尔模型 概率模型 向量空间模型 信息检索模型 模型估计 
统计语言模型综述被引量:37
《计算机科学》2003年第9期22-26,共5页邢永康 马少平 
国家重点基础研究(973)(G1998030509);自然科学基金项目(60223004);863高科技项目(No.2001AA114082)
1引言 统计语言模型产生于基于统计方法的自然语言处理系统的研究中:如语音识别系统、字符识别系统以及机器自动翻译系统等.对于一个语音识别系统,给定语音信号a和语言的句子集合S,则系统需要解决的问题可以表示为:
关键词:统计语言模型 自然语言处理系统 概率分解 语音识别系统 统计方法 信息处理 
基于统计语言模型的双向词类标注方法被引量:2
《计算机科学》2003年第9期59-60,168,共3页刘启和 詹思瑜 杨国纬 
1引言 在自然语言处理中,词类标注是一项重要的工作,它为句法分析、机器翻译、自然语言理解等提供语法知识.在进行自然语言的词类标注时,由于词的多词类现象,有许多词在不同的上下文中有不同的词类,汉语词类标注过程其实就是一个词类排...
关键词:自然语言处理 统计语言模型 双向词类标注方法 知识库 信息处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部