-

检索结果分析

结果分析中...
检索条件:"关键词=统计语言模型 "
条 记 录,以下是1-10
视图:
排序:
显示条数:
Short Texts Classification Through Reference Document Expansion被引量:12
《Chinese Journal of Electronics》2014年第2期315-321,共7页YANG Zhen FAN Kefeng LAI Yingxu GAO Kaiming WANG Yong 
supported by the National Natural Science Foundation of China(No.61001178,No.61172053,No.61202266);National Soft Science Research Program(No.2010GXQ5D317);Beijing Natural Science Foundation(No.4102012,No.4112009);Scientific Research Common Program of Beijing Municipal Commission of Education(No.KM201210005024);the National High Technology Research and Development Program of China(863 Program)(No.2012AA011706)
With the rapid development of information technology, short texts arising from socialized human interaction are gradually predominant in network information streams. Accelerating demands are requiring the industry to ...
关键词:Text classification Short texts Language model Document expansion External reference. 
一种提高文本检索准确性的关联方法
《计算机应用与软件》2010年第5期1-2,23,共3页施侃晟 刘海涛 舒平达 
国家自然科学基金(60373000)
文本检索就是从文本集中发现与用户查询相关的文本的过程。传统的基于查询似然检索模型没有考虑词项之间内在关系和外在共现关系。针对这些缺点,分别提出新关联方法分别予以解决。最后,通过实验对比证明新方法在查询精度上有了明显的提...
关键词:文本检索 统计语言模型 查询似然 
基于PAT TREE统计语言模型与关键词自动提取被引量:12
《计算机工程与应用》2001年第15期17-19,35,共4页杨文峰 李星 
国家863计划的资助(编号:863-306-ZD02-02-7)
未登录关键词的识别是中文信息处理中的一个关键问题。文章利用PAT TREE实现了一种可变长统计语言模型,由于不存在n元统计语言模型的截断效应,从而对待提取的关键词的长度没有限制。在该模型的基础上,通过相关性检测,从540M汉语语...
关键词:信息检索 统计语言模型 关键词 自动提取 PATtree INTERNET 
基于条件随机场的蒙古语词切分研究被引量:13
《中文信息学报》2010年第5期31-35,84,共6页赵伟 侯宏旭 从伟 宋美娜 
973前期研究项目资助(2007CB316503)
词干和构形附加成分是蒙古语词的组成成分,在构形附加成分中包含着数、格、体、时等大量语法信息。利用这些语法信息有助于使用计算机对蒙古语进行有效处理。蒙古语词在结构上表现为一个整体,为了利用其中的语法信息需要识别出词干和各...
关键词:蒙古语 词切分 词干 构形附加成分 条件随机场 统计语言模型 
词汇搭配和用户模型在拼音输入法中的应用被引量:6
《中文信息学报》2007年第4期105-110,共6页张玮 孙乐 冯元勇 李文波 黄瑞红 
中文输入法是中文信息处理的难题之一。随着互联网上中文用户的不断增加,中文输入法的重要性也变得日益突出。本文在对句子中长距离词汇依赖现象观察的基础上,抽取出语料库中的词汇搭配来获取长距离特征,并以此构建基于词汇搭配关系的...
关键词:计算机应用 中文信息处理 中文输入法 中文信息处理 统计语言模型 词汇搭配 长距离特征 用户模型 
基于最大熵方法的统计语言模型被引量:4
《计算机工程与应用》2002年第5期53-55,121,共4页徐延勇 郭忠伟 周献中 
国防科工委跨行业基金项目资助
针对现有统计语言模型中存在计算量过大和系统负担过重的问题,该文提出了一种基于最大熵方法的统计语言模型模型在参数估计阶段,引入约束最优化理论中拉格朗日乘数定理和牛顿迭代算法,以确保模型在多个约束条件中可求出最优化参数值;...
关键词:自然语言处理 统计语言模型 最大熵方法 鲁棒性 计算机 
Vari-gram language model based on word clustering
《Journal of Central South University》2012年第4期1057-1062,共6页袁里驰 
Project(60763001) supported by the National Natural Science Foundation of China;Project(2010GZS0072) supported by the Natural Science Foundation of Jiangxi Province,China;Project(GJJ12271) supported by the Science and Technology Foundation of Provincial Education Department of Jiangxi Province,China
Category-based statistic language model is an important method to solve the problem of sparse data.But there are two bottlenecks:1) The problem of word clustering.It is hard to find a suitable clustering method with g...
关键词:word similarity word clustering statistical language model vari-gram language model 
统计语言模型中词的自动聚类技术研究被引量:3
《计算机工程与应用》2003年第11期69-70,152,共3页高升 徐志明 
国家863项目"语音识别与语音合成的短语构成技术"资助(编号:863-306-03-02-1)
为了压缩基于词的统计语言模型的参数空间,以便构造模型空间更加紧密的ClassN-gram模型,该文研究了汉语词的自动聚类技术,提出了一种基于评价函数的汉语词的聚类算法,该算法采用词的相似度理论,并通过构造词的启发式候选词类链表,极大...
关键词:统计语言模型 聚类算法 评价函数 语义分类体系 
一种在线递增式语言模型自适应方法被引量:4
《中文信息学报》2002年第1期60-65,共6页吴根清 郑方 金凌 吴文虎 
本文针对传统统计语言模型的离线自适应方法 ,提出了一种在线实时的递增式自适应方法。该自适应方法需要解决几个问题。第一是要设计一种语言模型结构以适应在线的自适应 ;第二是如何利用在线收集到的语料对语言模型进行实时的参数修改 ...
关键词:统计语言模型 N-GRAM 自适应 语音识别 
中文问答系统中基于SLM的信息检索及其平滑技术研究
《计算机工程与科学》2010年第1期136-140,共5页钱如栏 董云耀 
为适应中文问答系统中汉语语言的特点,本文对信息检索模块进行了深入分析,相对于传统的主流信息检索模型,找到了一种更有效的检索方法——基于SLM的语言模型的信息检索技术(SLM-IR)。同时,研究了N-gram模型的参数N选取及其几种主要的数...
关键词:信息检索 统计语言模型 N—gram SLM-IR 平滑技术 
检索报告 对象比较 聚类工具 使用帮助 返回顶部