北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心

作品数:14被引量:110H指数:7
导出分析报告
发文作者:潘凡赵璞王克祥更多>>
发文领域:自动化与计算机技术更多>>
发文主题:机器翻译词义消歧方法词义消歧概念化短语更多>>
发文期刊:《电子学报》《软件学报》《情报工程》《自动化学报》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划山东省高等学校科技计划项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于短语向量和主题加权的关键词抽取方法被引量:3
《电子学报》2021年第9期1682-1690,共9页孙新 盖晨 申长虹 张颖捷 
国家重点研发计划项目(No.2017YFB0803300)。
现有关键词抽取算法缺乏对短语的有效表示,为抽取出更能反映文本主题的关键短语,本文提出一种基于短语向量的关键词抽取方法 PhraseVecRank.首先设计基于LSTM(Long Short-Term Memory)和CNN(Convolutional Neural Network)自编码器的短...
关键词:短语向量 自编码器 主题加权 关键词抽取 
抑制维汉神经机器翻译代词性别偏见的方法
《厦门大学学报(自然科学版)》2021年第4期693-700,共8页史学文 黄河燕 鉴萍 唐翼琨 
国家重点研发计划(2017YFB1002103);国家自然科学基金(61732005)。
利用神经机器翻译进行维吾尔语到汉语的翻译时,维吾尔语中的代词不区分性别,给翻译模型在汉语端使用正确的代词带来了挑战.另外,由于训练数据集中不同性别的代词使用频率差异明显,神经机器翻译倾向于输出阳性代词而不是更恰当的代词.基...
关键词:神经机器翻译 性别偏见 伪数据 性别预测 
基于注意力机制的概念化句嵌入研究被引量:8
《自动化学报》2020年第7期1390-1400,共11页王亚珅 黄河燕 冯冲 周强 
国家自然科学基金重点项目(61751201)资助。
大多数句嵌模型仅利用文本字面信息来完成句子向量化表示,导致这些模型对普遍存在的一词多义现象缺乏甄别能力.为了增强句子的语义表达能力,本文使用短文本概念化算法为语料库中的每个句子赋予相关概念,然后学习概念化句嵌入(Conceptual...
关键词:句嵌入 短文本概念化 注意力机制 词嵌入 语义表达 
多策略切分粒度的藏汉双向神经机器翻译研究被引量:7
《厦门大学学报(自然科学版)》2020年第2期213-219,共7页沙九 冯冲 张天夫 郭宇航 刘芳 
国家重点研发计划(2016YFB0801200,2018YFC0832104);国家自然科学基金(U1636203)。
现有的机器翻译模型通常在词粒度切分的数据集上进行训练,然而不同的切分粒度蕴含着不同的语法、语义的特征和信息,仅考虑词粒度将制约神经机器翻译系统的高效训练.这对于藏语相关翻译因其语言特点而显得尤为突出.为此提出针对藏汉双向...
关键词:音词融合 藏汉双向 神经机器翻译 
一种基于共享度模型的改进Rete算法被引量:9
《自动化学报》2017年第9期1571-1579,共9页孙新 严西敏 尚煜茗 欧阳童 董阔 
国家高技术研究发展计划(863计划)(2015AA015404)资助~~
专家系统是人工智能领域的重要分支,其中知识表示和知识推理是专家系统的重要组成部分.Rete算法是一种高效的模式匹配算法,能够解决专家系统中推理效率的问题,但是Rete算法在构建Rete网络和推理过程中存在空间和性能方面问题.本文采取...
关键词:专家系统 RETE算法 有穷自动机 推理机 
基于最小割图分割的社区发现算法被引量:3
《中文信息学报》2017年第3期213-222,共10页王亚珅 黄河燕 冯冲 
国家高技术研究发展计划(863计划)(2015AA015404)
该文证明了模块度最大化问题可以被转换成为原网络上的最小割图分割问题,并且基于该证明提出了一种高效的社区发现算法。同时,该文创新性地将模块度理论与当今比较流行的统计推理模型相结合:首先,这些统计推理模型被转化为模块度最大化...
关键词:社区发现 模块度 最小割图分割 
基于训练集裁剪的加权K近邻文本分类算法被引量:7
《情报工程》2016年第6期8-16,共9页孙新 欧阳童 严西敏 尚煜茗 郭文浩 
国家973课题(2013CB329605)的资助
文本分类是信息检索领域的重要应用之一,由于采用统一特征向量形式表示所有文档,导致针对每个文档的特征向量具有高维性和稀疏性,从而影响文档分类的性能和精度。为有效提升文本特征选择的准确度,本文首先提出基于信息增益的特征选择函...
关键词:文本分类 特征选择 信息增益 最近邻分类算法 
基于级联模型的中文情感要素抽取被引量:2
《电子学报》2016年第10期2459-2465,共7页王亚珅 黄河燕 冯冲 刘全超 
国家重点基础研究发展计划(973计划)资助项目(No.2013CB329605;No.2013CB329303);国家自然科学基金(No.61132009;No.61201351)
随着社交媒体的发展及成熟,每天在互联网环境中都会产生大量的用户评论信息.抽取评价短语、评价对象和观点持有者等情感要素,已经成为了中文观点挖掘和情感分析的重要先决任务.针对中文情感要素抽取任务,本文提出了一个统计和规则相结...
关键词:信息抽取 情感要素 评价短语 评价对象 观点持有者 
引入混合特征的最大名词短语双向标注融合算法被引量:4
《自动化学报》2015年第7期1274-1282,共9页李业刚 黄河燕 鉴萍 
国家重点基础研究发展计划(973计划);2013CB329303);国家自然科学基金(61132009;61202244;61201352)资助~~
最大名词短语的识别对机器翻译等诸多自然语言处理任务有着:惹要的意义.以汉语最大名词短语识别为研究任务,在分析现有方法的基础上,从汉语的语H学特殊性以及基于支持向量机的序列标注算法的特点出发,考查了基于混合特征的融合算法的适...
关键词:最大名词短语 双向标注 基本组块 混合特征 
多策略机器翻译研究综述被引量:21
《中文信息学报》2015年第2期1-9,23,共10页李业刚 黄河燕 史树敏 冯冲 苏超 
国家重点基础研究发展计划(973)(2013CB329303);国家自然科学基金(61132009);国家自然科学基金(61202244)
该文全面综述和分析了多策略机器翻译的研究。根据所采用策略方式的差异,我们将多策略机器翻译分为系统级策略融合和模块级策略融合。在分别介绍了不同的翻译方法后,着重介绍了系统级策略融合和模块级策略融合各自具有代表性的研究工作...
关键词:机器翻译 多策略机器翻译 融合机器翻译 混合机器翻译 多引擎机器翻译 
检索报告 对象比较 聚类工具 使用帮助 返回顶部