N元语言模型

作品数:8被引量:50H指数:4
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:徐波付晓寅顾明亮沈兆勇周新栋更多>>
相关机构:中国科学院自动化研究所中国科学院国防科学技术大学南京大学更多>>
相关期刊:《新疆大学学报(哲学社会科学版)(维吾尔文)》《小型微型计算机系统》《计算机技术与发展》《计算机应用》更多>>
相关基金:国家自然科学基金江苏省哲学社会科学“十五”规划基金江苏省高校自然科学研究项目国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-8
视图:
排序:
连续手语识别中的文本纠正和补全方法被引量:1
《计算机应用》2021年第3期694-698,共5页龙广玉 陈益强 邢云冰 
国家重点研发计划项目(2018YFC2002603)。
针对基于视频的连续手语识别的文本结果存在语义模糊、语序混乱的问题,提出一种两步法将连续手语识别结果的手语文本转化为通顺、可懂的汉语文本。第一步,基于自然手语规则以及N元语言模型(N-gram)对连续手语识别的结果进行文本调序;第...
关键词:连续手语识别 N元语言模型 文本调序 双向长短记忆网络 量词补全 
无监督分词算法在新词识别中的应用被引量:2
《小型微型计算机系统》2020年第4期888-892,共5页姜涛 陆阳 张洁 洪建 
安徽省教育厅重点项目(SK2018A0154)资助;国家重点研发计划专项项目(2016YFC0801804)资助。
新词识别过程中,使用分词工具进行预分词的方法,受限于训练语料而对某些领域的分词准确率不佳.针对这个问题,本文提出了一种改进方法.该方法首先基于元语言模型进行无监督预分词,再将词频、互信息和邻接熵作为主要特征进行新词发现.同...
关键词:新词识别 互信息 邻接熵 N元语言模型 中文分词 
一种软/硬模板相结合的定义抽取算法被引量:4
《计算机技术与发展》2012年第9期32-36,共5页钱菲 袁春风 
国家自然科学基金资助项目(61072152;61021062)
术语定义抽取是信息抽取研究领域的重要内容之一。文中提出了一种结合硬模板匹配和软模板匹配技术的综合术语定义自动抽取方法。文中首先使用硬模板库对待抽取文本进行了初步的定义句匹配抽取。接着,通过使用基于N元语言模型的软模板匹...
关键词:定义抽取 硬模板匹配 软模板匹配 N元语言模型 词类格 
基于N-gram的维吾尔弹词字母结构分析
《新疆大学学报(哲学社会科学版)(维吾尔文)》2012年第2期52-61,共10页
本文使用N元语言模型,针对维吾尔语详细词典中的维吾尔语单词进行字母构成统计分析。使用Morogram工具,以字母为主要分析单位,对维吾尔语单词的构词特性进行研究。本文研究成果可以进一步提高我们对维吾尔语构词方法的理解,在语言...
关键词:维吾尔语 N-GRAM 结构分析 字母 N元语言模型 统计分析 研究成果 机器翻译 
基于N-gram语言模型的汉字识别后处理研究被引量:5
《微计算机信息》2009年第10期276-278,共3页董广宇 吕学强 王涛 施水才 
基金申请人:吕学强;项目名称:基于大规模真实文本的新词发现研究;基金颁发部门:北京市教委(KM200710772010)
为提高汉字文本的识别率,本文将基于统计的N-gram元语言模型和单字识别器概率模型结合起来,以充分利用单字识别器提供的信息。该方法把具有确定性边界的一个汉字序列(多数情况为一个句子)作为一个处理单元,利用统计获得的字字同现概率...
关键词:N元语言模型 维特比算法 汉字识别 后处理 
基于语音配列的汉语方言自动辨识被引量:19
《中文信息学报》2006年第5期77-82,共6页顾明亮 沈兆勇 
江苏省"十五"社科基金资助项目(K3-013);江苏省高校自然科学基金资助项目(99KJB510002)
本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征。然后利用GMM符号发生器和N元语言模型及ANN建立了一个方言辨识系统,该系统与传统的语种识别系统相比,具有以下特点:第一,系统不需要标注好的语音...
关键词:计算机应用 中文信息处理 GMM符号化器 N元语言模型 汉语方言辨识 
基于N元语言模型的文本分类方法被引量:11
《计算机应用》2005年第1期11-13,16,共4页周新栋 王挺 
国家863计划资助项目(2001AA114110)
分类是近年来自然语言处理领域的一个研究热点。在分析了传统的分类模型后,文中提出了用N元语言模型作为中文文本分类模型。该模型不以传统的"词袋"(bagofwords)方法表示文档,而将文档视为词的随机观察序列。根据该方法,设计并实现一个...
关键词:文本分类 N元语言模型 参数平滑 
汉语统计语言模型的N值分析被引量:8
《中文信息学报》1998年第1期35-41,共7页张树武 黄泰翼 
国家自然科学基金
N元语言模型(n-gram)作为统计语言处理的主要方法,目前在汉语语言处理(词性标注、字符识别、语音识别等)中已得到广泛的应用。但是,具体N取何值为较优,目前尚没有明确的定论。本文从对汉语短语语法模式的近似表示、对未...
关键词:语音识别 汉语 统计语言模型 N元语言模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部