统计语言模型

作品数:106被引量:473H指数:11
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:黄永文郑方吴文虎何中市荀恩东更多>>
相关机构:清华大学哈尔滨工业大学重庆大学北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划教育部科学技术研究重点项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
层次概念的分布式表示和学习方法综述
《计算机技术与发展》2023年第10期1-7,共7页朱晓光 
国家自然科学基金(71774101,61802230);江苏省现代教育技术研究课题(2021-R-87014)。
层次概念能够有效解释语言模型的隐含知识,并且提升语言模型的结构化优化性能。针对层次概念表示和学习模型的多样化发展,该文分析了层次概念表示的线性空间、概率空间和文本蕴含性质,梳理了概念学习模型的层次结构和优化原理,用于促进...
关键词:层次概念 概念学习 分布式表示 统计语言模型 层次主题模型 
现代藏语信息熵的估算及语言模型的复杂度
《电子技术与软件工程》2020年第17期213-215,共3页完么扎西 
国家社科基金项目(19XYY021)资助
本文将信息论的方法引入藏文信息处理技术研究领域,采用一种基于统计语言模型的信息熵估计方法,在300多万(音节)字的藏语单语语料规模上,对不同藏语语言模型估算了信息熵及其复杂度。
关键词:统计语言模型 信息熵 复杂度 
文本分类中支持向量机研究
《河南科技》2019年第29期8-10,共3页何焱 
贵州省“千”层次创新型人才培养项目(遵市科合人才[2017]24号)
随着我国现代科技的快速发展,文本分类逐渐在信息化技术与数字化技术领域得到重视。利用计算处理系统处理文本信息,能够有效提升文本分类的质量与效率,提升数据信息的利用率,从而促进信息化技术的普及。而支持向量机是处理文本内容,加...
关键词:文本分类 支持向量机 统计语言模型 
基于统计语言模型改进的Word2Vec优化策略研究被引量:13
《中文信息学报》2019年第7期11-19,共9页张克君 史泰猛 李伟男 钱榕 
国家重点研发计划(2018YFB1004101);国家自然科学基金(61170037)
该文从训练词向量的语言模型入手,研究了经典skip-gram、CBOW语言模型训练出的词向量的优缺点,引入TFIDF文本关键词计算法,提出了一种基于关键词改进的语言模型。研究发现,经典skip-gram、CBOW语言模型只考虑到词本身与其上下文的联系,...
关键词:词向量 统计语言模型 TFIDF 文本关键词 CBOW-TFIDF 
基于方法约束关系的代码预测模型
《计算机科学》2019年第1期219-225,共7页方文渊 刘琰 朱玛 
国家重点研发计划基金(2017YFB0802900)资助
最新的研究表明,从大量源代码中提取代码特征,建立统计语言模型,对代码有着良好的预测能力。然而,现有的统计语言模型在建模时,往往采用代码中的文本信息作为特征词,对代码的语法结构信息利用不充分,预测准确率仍有提升空间。为提高代...
关键词:统计语言模型 方法的约束关系 代码预测 方法调用 
机器学习方法在文本分类中的应用被引量:3
《电子制作》2018年第18期61-62,64,共3页韩琪恒 
文本分类在文本信息处理过程中有关键作用,能帮助人们提取有用信息,有效组织文本信息。本文主要介绍了文本分类的背景、国内外的研究现状以及利用机器学习方法解决文本分类问题的一般步骤。文章第二部分对中文分词、特征向量提取、分类...
关键词:文本分类 中文分词 统计语言模型 神经网络模型 
中文分词相关算法研究被引量:6
《科技经济导刊》2018年第2期122-123,共2页吴熠潇 
本文主要介绍了基于统计语言模型的中文分词方法。第一部分介绍了什么是中文分词以及中文分词的意义;第二部分介绍了中文分词的国内研究现状和当前的研究热点;第三部分是文章主要部分,介绍了统计语言模型,利用隐马尔可夫假设简化语言模...
关键词:中文分词 统计语言模型 隐马尔可夫假设 
基于文献的地质实体关系抽取方法研究被引量:5
《中国矿业》2017年第10期167-172,共6页吕鹏飞 王春宁 朱月琴 
国土资源部公益性行业科研专项项目资助(编号:201511079);国家重点研发计划"基于‘地质云’平台的深部找矿知识挖掘"资助(编号:2016YFC0600510)
实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语...
关键词:文献 关系抽取 统计语言模型 BOOTSTRAPPING 
基于概率潜在语义分析优化拼音汉字转换被引量:1
《信息技术》2016年第11期33-37,41,共6页郑叶清 刘功申 
973计划(2013CB329603);国家自然科学基金项目(61472248;61171173)
文中拼音汉字转换在中文处理中有诸多应用。文中提出基于概率潜在语义获取拼音汉字转换过程之中文本所存在的潜在语义知识,从而将长距离的语义知识与拼音汉字转换模型相结合,提升汉字转换准确率;同时在实验中研究引入更多文本知识增强...
关键词:概率潜在语义分析 拼音汉字转换 统计语言模型 
动态规划算法对GenoCAD设计结果的优化(英文)
《生物信息学》2016年第3期173-180,共8页方刚 
国家自然科学基金项目(No.61173113)
Geno CAD(www.genocad.com)是一种基于Web的免费合成生物学设计软件,用它可以进行表达载体及人工基因网络设计。持续点击代表各种合成生物学标准"零件"的图标,以一种语法进行设计,最后就可以得到由数十个功能片段组成的复杂质粒载体。...
关键词:合成生物学 统计语言模型 动态规划算法 生物学“零件” GenoCAD 
检索报告 对象比较 聚类工具 使用帮助 返回顶部