最大熵分类器

作品数:19被引量:153H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周国栋李寿山王红玲车万翔刘挺更多>>
相关机构:苏州大学哈尔滨工业大学江苏省计算机信息处理技术重点实验室沈阳航空航天大学更多>>
相关期刊:《昆钢科技》《中文信息学报》《山西大学学报(自然科学版)》《山东大学学报(工学版)》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金江苏省高校自然科学研究项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种基于最大熵分类器的新闻事件关联特征抽取方法研究
《昆钢科技》2023年第2期54-57,共4页韩超 
为了能够准确的识别出新闻事件的关联关系,本文对事件的内部结构和属性特征进行了分析和研究,归纳出7种对事件关联性起到关键性作用的影响因子,并采用最大熵分类器模型来对新闻事件语料进行标注、训练,最终完成对这7种影响因子的自动抽...
关键词:新闻事件 事件关联特征 最大熵 
中文在线评论的用户性别判定研究被引量:1
《通化师范学院学报》2016年第12期69-72,共4页胡龙茂 
安徽省高校自然科学研究重点项目(KJ2016A009)
该文旨在研究中文在线评论的用户性别判定问题,即根据用户的商品评论识别用户的性别.首先研究了在线评论中对用户性别起指示作用的信息,然后从用户名、商品描述和评论文本中抽取特征,分别采取独立特征、叠加特征及融合特征的方式构建最...
关键词:性别判定 中文在线评论 最大熵分类器 
基于最大熵模型的英柬双语平行句对获取被引量:1
《山西大学学报(自然科学版)》2015年第4期588-594,共7页严馨 王若兰 余正涛 潘丽同 郭剑毅 
国家自然科学基金(NO.61462055;61472168);云南省自然科学基金重点项目2013FA130
英语-柬埔寨语双语平行语料库资源是柬埔寨语信息处理的一项基础资源,对于促进柬埔寨语言信息处理技术的发展具有非常重要的研究意义。在得到平行的双语网页之后,将平行句对的获取问题看作是对候选平行句对的分类问题。为了从候选平行...
关键词:英柬双语平行语料库 最大熵分类器 平行句对 
基于多特征的英汉术语译文质量自动评价
《沈阳航空航天大学学报》2014年第6期59-65,共7页林康静 李楠 叶娜 蔡东风 
国家"十二五"科技支撑计划项目(项目编号:2012BAH14F00)
该文通过深入分析术语的语言学特点和领域特点,引入了能充分刻画术语译文流利度、紧密度和忠实度的三类特征,即术语构词、互信息和术语实例库,将其与基础特征进行组合,采用机器学习方法中的排序学习算法将列表排序问题分解成二分类问题...
关键词:术语 特征 质量评价 最大熵分类器 
基于有监督学习方法的多文档文本情感摘要被引量:3
《中文信息学报》2014年第6期143-149,共7页李艳翠 林莉媛 周国栋 
国家863计划前沿技术研究类项目(2012AA011102);NSFC面上项目(61273320)
该文研究有监督学习方法在多文档文本情感摘要中的应用。利用从亚马逊中文网和亚马逊英文网上收集的产品评论语料,抽取文本内特征、PageRank特征、情感特征和评论质量特征,基于有监督方法进行多文档文本情感摘要抽取。实验结果表明有监...
关键词:情感摘要 评论质量 情感特征 有监督学习 最大熵分类器 
汉语显式篇章关系分析被引量:1
《中文信息学报》2014年第6期101-106,共6页丁彬 孔芳 李生 周国栋 
国家自然基金(61333018);国家自然基金(61273320);国家863(2012AA011102)
篇章关系分为显式和隐式两种。显式关系的显著特征是篇章的基本单元之间存在显式连接词。针对汉语显式篇章关系,构建了包括汉语连接词识别和篇章关系分类的显式篇章关系分析平台。该文选取汉语宾州树库(Chinese Penn Treebank,CTB)中的...
关键词:连接词识别 语义关系分类 最大熵分类器 
基于多特征融合的统计机器翻译译文错误检测
《西安理工大学学报》2013年第1期32-37,共6页王莎 杜金华 刘丁 
国家自然科学基金资助项目(61100085);陕西省教育厅专项科研计划基金资助项目(11JK1029)
抽取了3种典型的单词后验概率特征(基于固定位置的词后验概率、基于目标位置窗的词后验概率、基于词对齐的词后验概率)和3种语言学特征(词、词性、句法分析器抽取的句法特征),并在此基础上抽取了一个来自源端的单词特征,然后基于中英NIS...
关键词:最大熵分类器 单词后验概率 语言学特征 源端单词特征 错误检测 
基于特征比较和最大熵模型的统计机器翻译错误检测
《北京大学学报(自然科学版)》2013年第1期81-87,共7页杜金华 王莎 
国家自然科学基金(61100085);陕西省教育厅专项科研计划项目(11JK1029);西安理工大学青年科技研究计划项目(105211017)资助
首先介绍3种典型的用于翻译错误检测和分类的单词后验概率特征,即基于固定位置的词后验概率、基于滑动窗的词后验概率和基于词对齐的词后验概率,分析其对错误检测性能的影响;然后,将其分别与语言学特征如词性、词及由LG句法分析器抽取...
关键词:错误检测 词后验概率 语言学特征 最大熵分类器 
基于最大熵分类器的藏文句子边界自动识别方法研究被引量:10
《计算机工程与科学》2012年第6期187-190,共4页才藏太 
青海省科技支撑项目(2011-Z-754;2011-Z-755)
藏文句子的边界识别是藏文文本分析的基础性研究,是藏文与其他语种之间建立句子级平行语料库的必要工作,也是进一步进行藏汉机器翻译的基础。本文通过分析藏文句子的结束形式,研究藏文句子边界规则,提出了一种藏文句子的边界识别方法。...
关键词:藏文句子 边界识别 最大熵模型 
基于信息熵的半监督领域实体关系抽取研究被引量:3
《山东大学学报(工学版)》2011年第4期7-12,共6页郭剑毅 雷春雅 余正涛 苏磊 赵君 田维 
国家自然科学基金项目(60863011);云南省自然科学基金重点项目资助项目(2008CC023);云南省中青年学术技术带头人后备人才项目资助项目(2007PY01-11)
针对监督机器学习方法抽取实体关系受限于标注语料的规模问题,提出采用信息熵方法来不断扩展小规模训练数据的半监督领域实体关系抽取。结合领域词汇选取小规模训练数据,构建了一定准确率的初始最大熵分类器,用来从未标记数据中预测出...
关键词:信息熵 半监督 最大熵分类器 未标记 可信度 
检索报告 对象比较 聚类工具 使用帮助 返回顶部