N-GRAM语言模型

作品数:15被引量:87H指数:6
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:吴文虎关毅王晓龙金凌徐志明更多>>
相关机构:清华大学新疆大学哈尔滨工业大学重庆邮电大学更多>>
相关期刊:《西北民族大学学报(自然科学版)》《清华大学学报(自然科学版)》《计算机工程与应用》《现代电子技术》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划山东省自然科学基金中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
中文文本拼写纠错研究综述
《现代信息科技》2025年第8期138-145,共8页沈友志 程春雷 句泽东 龚著凡 
江西省自然科学基金资助项目(20224BAB206102);江西省教育厅科学技术研究项目(GJJ2200923);国家自然科学基金(82260988);江西省卫生和计划生育委员会-科技计划项目(202211404)。
中文文本拼写纠错(Chinese Spelling Correction,CSC)在自然语言处理(NLP)领域中是一个关键的基础任务,可为其下游任务和研究提供支持。CSC任务领域的研究持续发展,主要分为基于N-Gram语言模型、深度学习和大语言模型的纠错方法。首先对...
关键词:中文文本 拼写纠错 N-GRAM语言模型 深度学习 大语言模型 
RDF问答系统中一种基于N-gram的消歧方法被引量:1
《小型微型计算机系统》2022年第5期969-975,共7页江伟豪 严丽 屠要峰 周祥生 李忠良 
江苏省基础研究计划项目(BK20191274)资助。
由于知识网络与互联网应用的高速发展,RDF(Resource Description Framework,资源描述框架)被广泛应用到关联数据的存储以及知识图谱的创建当中.基于自然语言处理的RDF问答系统是普通用户查询RDF数据的高效方法.在处理自然语言的过程中...
关键词:RDF问答系统 N-GRAM语言模型 自然语言处理 消歧 
面向在线评论的领域情感词典的自动构建被引量:2
《现代计算机》2021年第18期79-84,共6页宗宇 方朝阳 吴波 
国家社科基金艺术学重大项目:革命文物保护利用实践经验与制度创新研究(No.19ZD27);文化艺术和旅游研究项目信息化发展专项:基于VR/AR和智能匹配的陶瓷艺术品在线推荐、定制、体验和交易一体化云平台(No.xxhfzzx201907)。
为改善现有传统情感词典无法精准捕捉乡村旅游情感词的情况,提出了一种面向在线评论自动构建乡村型情感词典的方法。以江西婺源为研究区域,利用网络爬虫采集了1.6万条微博评论。通过采用N-Gram语言模型和TF-IDF词频统计设置阈值筛选出...
关键词:N-GRAM语言模型 TF-IDF 词义相似度 词典构建 乡村旅游 
基于CNN-HMM和RNN的维吾尔语语音识别被引量:4
《现代电子技术》2021年第11期172-176,共5页穆凯代姆罕·伊敏江 艾斯卡尔·艾木都拉 米吉提·阿不里米提 
国家自然科学基金项目(61662078);国家重点研发计划(2017YFC0820602)。
神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语...
关键词:语音识别 维吾尔语 声学模型 语言模型 CNN-HMM N-GRAM语言模型 循环神经网络 Kaldi 
藏语N-gram语言模型中的平滑技术研究被引量:1
《西北民族大学学报(自然科学版)》2019年第4期26-30,共5页仁青吉 
文章在Linux环境下搭建Srilm建模平台,然后对语料进行分块处理,并用N-gram count和N-gram进行计数和语言模型的建立,利用几种平滑算法对其进行了困惑度的测试,最后对这几个困惑度的数值进行比较和数据分析,总结出一个适用于当前语料和...
关键词:藏语语言模型 N-GRAM 平滑算法 困惑度 
不同维度下维吾尔语N-gram语言模型性能分析被引量:5
《现代电子技术》2019年第10期27-30,共4页毛丽旦.尼加提 古丽尼尕尔.买合木提 艾斯卡尔.艾木都拉 
国家自然科学基金项目:面向汉维机器翻译性能优化的关键技术研究(61562081)~~
针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram语言模型做了对比实验,试图找出在一定规模的维吾尔语语料条件下使困惑度最低的N-gram语言模型。通过对...
关键词:N-GRAM语言模型 性能分析 SRILM MITLM 困惑度 平滑算法 机器翻译 
基于N-Gram语言模型的并行自适应新闻话题追踪算法被引量:11
《山东大学学报(工学版)》2018年第6期37-43,共7页屈庆涛 刘其成 牟春晓 
山东省自然科学基金(ZR2016FM42);山东省重点研发计划(2016GGX109004);国家海洋局"十三五"海洋经济创新发展示范重点项目(YHC-ZB-P201701);国家自然科学基金(61702439)
针对传统的向量空间模型及一元语法模型表示话题的文本特征时忽略词语之间语序关系的问题,提出一种基于NGram语言模型的并行自适应新闻话题追踪算法。使用N-Gram语言模型,利用新闻报道中词语间的语序关系进行文本表示,根据贝叶斯分类算...
关键词:话题跟踪 N-GRAM语言模型 朴素贝叶斯分类 MapReduce计算模型 
一种基于聚类的微博关键词提取方法的研究与实现被引量:9
《信息网络安全》2014年第12期27-31,共5页孙兴东 李爱平 李树栋 
国家科技支撑计划[2012BAH38B00];国家自然科学基金[61202362;61262057];中国博士后科学基金[2013M542560]
文章提出了一种基于聚类的微博关键词提取方法。实验过程分三个步骤进行。第一步,对微博文本进行预处理和分词处理,再运用TF-IDF算法与Text Rank算法计算词语权重,针对微博短文本的特性在计算词语权重时运用加权计算的方法,在得到词语...
关键词:微博关键词 聚类算法 TF-IDF TextRank N-GRAM语言模型 
基于N-gram语言模型的哈萨克文机构名识别被引量:2
《计算机工程与应用》2010年第31期135-138,共4页冯鲸华 古丽拉.阿东别克 玛依来.哈帕尔 
国家自然科学基金No.60763005;国家教育部;国家语委民族语言文字规范标准建设及信息化科研项目(No.MZ115-92)~~
针对哈萨克文文本中机构名构成特点,提出了一种基于N-gram语言模型的哈萨克文机构名可信度计算方法,并以机构名尾词为触发词,构建了一个哈萨克文机构名识别系统。系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训...
关键词:N—gram语言模型 哈萨克文机构名识别 实体名识别 
基于N-gram语言模型的汉字识别后处理研究被引量:5
《微计算机信息》2009年第10期276-278,共3页董广宇 吕学强 王涛 施水才 
基金申请人:吕学强;项目名称:基于大规模真实文本的新词发现研究;基金颁发部门:北京市教委(KM200710772010)
为提高汉字文本的识别率,本文将基于统计的N-gram元语言模型和单字识别器概率模型结合起来,以充分利用单字识别器提供的信息。该方法把具有确定性边界的一个汉字序列(多数情况为一个句子)作为一个处理单元,利用统计获得的字字同现概率...
关键词:N元语言模型 维特比算法 汉字识别 后处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部