N元文法

作品数:17被引量:81H指数:5
导出分析报告
相关领域:自动化与计算机技术电子电信更多>>
相关作者:齐浩亮何晓宁韩咏刘颖王作英更多>>
相关机构:黑龙江工程学院哈尔滨工业大学清华大学中国科学院更多>>
相关期刊:《计算机工程与应用》《电子学报》《黑龙江工程学院学报》《中文信息学报》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划黑龙江省科技攻关计划黑龙江省教育厅科学技术研究项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于共现分析的分类器链标签序列优化方法被引量:3
《系统工程与电子技术》2021年第9期2526-2534,共9页赖德迪 罗智徽 马应龙 
国家重点研发计划(2018YFC0831404,2018YFC0830605)资助课题.
针对分类器链模型采用随机生成方式确定标签序列会极大影响分类器链性能的问题。通过共现分析技术深入挖掘标签间的潜在关系,提出一种基于贪心算法和n-gram模型的两种标签序列优化策略以提升分类器链模型性能。基于贪心算法的策略通过...
关键词:多标签分类 分类器链 共现分析 N元文法 二元相关性 
基于上下文特征分类的评论长句切分方法被引量:2
《计算机工程》2015年第9期233-237,244,共6页陈鸿 金培权 岳丽华 胡玉娟 殷凤梅 
合肥师范学院青年基金资助项目(2015QN06)
商品评论文本对消费者和商家的决策都有重要参考价值。用户在评论中使用的语言较为随意,语法结构不规则,给文本分析带来很大难度。正确的句子切分是文本信息抽取和挖掘工作的基础。为解决商品评论中用户省略标点情况下的句子切分问题,...
关键词:句子切分 标点省略 机器学习 上下文特征 N元文法 逻辑回归 
基于聚类和分类的金庸与古龙小说风格分析被引量:12
《中文信息学报》2015年第5期167-177,共11页肖天久 刘颖 
清华大学人文社科振兴基金(20145081042);国家自然科学基金(61433015)
该文以金庸与古龙的小说作为语料,从计算风格学的角度考察二人的风格差异。对比了两人小说的文本从众性、句子破碎度,同时,使用文本聚类的方法对词和词类的N元文法,标点符号的N元文法以及多种特征的总体情况进行了考察,还使用主成分分...
关键词:计算风格学 N元文法 聚类 分类 句子破碎度 
《红楼梦》词和N元文法分析被引量:10
《现代图书情报技术》2015年第4期50-57,共8页肖天久 刘颖 
国家自然科学基金项目"基于语用信息的交互行为与语言特征的建模研究"(项目编号:61171114);教育部自主科研项目"基于大规模语料库的社会语用信息网的构建"(项目编号:20111081010)的研究成果之一
【目的】研究《红楼梦》前八十回与后四十回的关系,从而判定《红楼梦》是否为一人所写。【方法】定量统计和定性分析相结合,比较前、中、后四十回的独有词;利用虚词、词及词类的N元文法模型、实词以及词长进行聚类;计算三个部分的相似...
关键词:风格分析 层次聚类 K—means聚类 N元文法 
基于MicroWindows的多设备支持智能中文输入系统被引量:1
《计算机应用》2013年第7期2067-2070,2082,共5页周慧娟 向荣 
国家863计划项目(2010AA09Z104)
针对现有嵌入式中文输入系统输入设备种类支持单一、中文输入引擎效率低、用户体验差等问题,提出一种基于MicroWindows的智能中文输入系统。系统首先在前端的设备输入实现层模块式完成了不同类型的设备消息封装投递,然后在消息处理中心...
关键词:N元文法模型 MICROWINDOWS 多设备支持 中文输入法 
基于扩展N元文法模型的快速语言模型预测算法被引量:6
《自动化学报》2012年第10期1618-1626,共9页单煜翔 陈谐 史永哲 刘加 
国家高技术研究发展计划(863计划)(2008AA040201);国家自然科学基金(90920302);国家科技支撑计划(2009BAH41B01);国家自然科学基金委员会与香港研究资助局联合科研基金(60931160443)资助~~
针对基于动态解码网络的大词汇量连续语音识别器,本文提出了一种采用扩展N元文法模型进行快速语言模型(Language model,LM)预测的方法.扩展N元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法,从而大大简化了解码器的实现...
关键词:语音识别 语言模型预测 N元文法模型 解码 
军用文书自动生成中表层实现的概率模型
《兵工自动化》2010年第11期60-62,73,共4页郭忠伟 桑殿伟 郑华利 李洪峰 
一种基于语料库的军用文书自动生成中表层实现的概率模型。运用最大熵模型,把N元文法语法模型获取的生成文本中词汇间的同现概率信息、句法依赖树中的句法信息和属性信息进行有机结合,生成文书文本。实验结果证明,该模型可以逐个词汇地...
关键词:军用文书 表层实现 N元文法 最大熵模型 
基于逻辑回归模型的中文垃圾短信过滤被引量:2
《黑龙江工程学院学报》2010年第4期36-39,共4页郑晓霞 刘超 邹钰 
黑龙江省教育厅资助项目(11551401)
设计并实现中文垃圾短信过滤器,能够较好识别不断变化的垃圾短信。以逻辑回归模型为基础,提出字节级n元文法提取短信特征,并采用TONE(Train On or Near Error)方法训练过滤器。通过实验测试,证明应用该方法实现的垃圾短信过滤效果很好。
关键词:中文垃圾短信过滤 逻辑回归模型 N元文法 TONE 
高性能中文垃圾邮件过滤器被引量:7
《中文信息学报》2010年第2期76-83,共8页齐浩亮 程晓龙 杨沐昀 何晓宁 李生 雷国华 
国家自然科学基金重点资助项目(60736044);国家自然科学基金资助项目(60873105);黑龙江省科技攻关计划资助项目(GZ07A108)
设计并实现了基于在线过滤模式高性能中文垃圾邮件过滤器,能够较好地识别不断变化的垃圾邮件。以逻辑回归模型为基础,该文提出了字节级n元文法提取邮件特征,并采用TONE(Train On or Near Error)方法训练过滤器。在多个大规模中文垃圾邮...
关键词:计算机应用 中文信息处理 中文垃圾邮件过滤 在线学习 逻辑回归模型 字节级n元文法 TONE 
潜在语义分析在连续语音识别中的应用
《计算机工程与应用》2009年第32期111-113,共3页欧建林 林茜 史晓东 
国家自然科学基金No.60573189;国家高技术研究发展计划(863)No.2006AA01Z139;No.2006AA010107;No.2006AA010108;福建省自然科学基金No.2006J0043~~
研究了潜在语义分析(LSA)理论及其在连续语音识别中应用的相关技术,在此基础上利用WSJ0文本语料库上构建LSA模型,并将其与3-gram模型进行插值组合,构建了包含语义信息的统计语言模型;同时为了进一步优化混合模型的性能,提出了基于密度...
关键词:潜在语义分析 N元文法 K均值聚类 连续语音识别 
检索报告 对象比较 聚类工具 使用帮助 返回顶部