国际科技合作与交流专项项目(K11F100010)

作品数:15被引量:39H指数:3
导出分析报告
相关作者:张玉洁徐金安陈钰枫赵紫玉明芳更多>>
相关机构:北京交通大学联想研究院更多>>
相关期刊:《北京大学学报(自然科学版)》《计算机工程与应用》《中文信息学报》《计算机与现代化》更多>>
相关主题:复述依存统计模型知识库多任务学习更多>>
相关领域:自动化与计算机技术文化科学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
融合深度语义表示的开放域复述模板抽取被引量:2
《情报工程》2021年第5期40-50,共11页金波 刘明童 张玉洁 徐金安 陈钰枫 
国家自然科学基金(61876198,61976015,61370130,61473294);北京市自然科学基金(4172047);科学技术部国际科技合作计划(K11F100010)
[目的/意义]复述知识在自然语言处理领域应用广泛,例如复述生成、自动问答、复述数据构建等,复述模板是复述知识的一种抽象表现形式。[方法/过程]早期复述模板抽取方法依赖复述实例和可比语料,近年来,有研究在人工给定种子实体对的基础...
关键词:复述模板 语义表示 自动聚类 
基于多翻译引擎的汉语复述平行语料构建方法被引量:3
《情报工程》2020年第5期27-40,共14页王雅松 刘明童 马彬彬 张玉洁 徐金安 陈钰枫 
国家自然科学基金(61876198,61976015,61370130,61473294);北京市自然科学基金(4172047);科学技术部国际科技合作计划(K11F100010)。
复述指同一语言内相同意思的不同表达,复述生成指同一种语言内意思相同的不同表达之间的转换,是改进信息检索、机器翻译、自动问答等自然语言处理任务不可或缺的基础技术。目前,复述生成模型性能都依赖于大量平行的复述语料,而很多语言...
关键词:复述语料构建 汉语复述现象分类 复述生成 多任务学习 自编码任务 
融合门控机制的远程监督关系抽取方法被引量:3
《北京大学学报(自然科学版)》2020年第1期39-44,共6页李兴亚 陈钰枫 徐金安 张玉洁 
国家自然科学基金(61976016,61473294,61370130,61876198);北京市自然科学基金(4172047);科学技术部国际科技合作计划(K11F100010)资助
提出一种融合门控机制的远程监督关系抽取方法。首先在词级别上自动选择正相关特征,过滤与关系标签无关的词级别噪声;然后在门控机制内引入软标签的思想,弱化硬标签对噪声过滤的影响;最后结合句子级别的噪声过滤,提升模型的整体性能。...
关键词:关系抽取 远程监督 门控机制 卷积神经网络 
基于句法结构的神经网络复述识别模型被引量:3
《北京大学学报(自然科学版)》2020年第1期45-52,共8页刘明童 张玉洁 徐金安 陈钰枫 
国家自然科学基金(61876198,61976015,61370130,61473294);中央高校基本科研业务费专项资金(2018YJS025);北京市自然科学基金(4172047);科学技术部国际科技合作计划(K11F100010)资助
为解决已有复述语义计算方法未考虑句法结构的问题,提出基于句法结构的神经网络复述识别模型,设计基于树结构的神经网络模型进行语义组合计算,使得语义表示从词语级扩展到短语级。进一步地,提出基于短语级语义表示的句法树对齐机制,利...
关键词:复述识别 句法结构 树结构神经网络 注意力机制 
联合自编码任务的多机制融合复述生成模型
《北京大学学报(自然科学版)》2020年第1期53-60,共8页刘明童 张玉洁 张姝 孟遥 徐金安 陈钰枫 
国家自然科学基金(61876198,61976015,61370130,61473294);中央高校基本科研业务费专项资金(2018YJS025);北京市自然科学基金(4172047);科学技术部国际科技合作计划(K11F100010)资助
基于神经网络编码–解码框架的复述生成模型存在两方面的问题:1)生成的复述句中存在实体词不准确、未登录词和词汇重复生成;2)复述平行语料的有限规模限制了编码器的语义学习能力。针对第一个问题,本文提出在解码过程中融合注意力机制...
关键词:复述生成 自编码 多任务学习 多机制融合 注意力机制 复制机制 覆盖机制 
采用Stack-Tree LSTM的汉语一体化依存分析模型被引量:2
《中文信息学报》2019年第1期10-17,共8页刘航 刘明童 张玉洁 徐金安 陈钰枫 
国家自然科学基金(61876198;61370130);中央高校基本科研业务费专项资金(2018YJS025;2015JBM033);科学技术部国际科技合作计划(K11F100010)
在汉语一体化依存分析中,如何利用分词、词性标注和句法分析的中间结果作为分析特征成为核心问题,也是三个任务相互制约协调、共同提高性能的关键所在。目前无论基于特征工程的方法还是基于深度学习的方法尚无法充分利用分析过程中依存...
关键词:中文分词、词性标注和依存分析 依存子树 神经网络 
基于多特征融合编码的神经网络依存句法分析模型
《中文信息学报》2018年第12期41-47,共7页刘明童 张玉洁 徐金安 陈钰枫 
中央高校基本科研业务费专项资金(2018YJS025;2015JBM033);国家自然科学基金(61370130;61473294);国家自然科学基金(61876198);科学技术部国际科技合作计划(K11F100010)
在基于神经网络的依存句法分析中,对分析栈和决策层信息的表示和利用依然有值得深入研究的空间。针对分析栈的表示,已有工作并没有对单棵依存子树独立编码的表示,导致无法利用各个依存子树的局部特征;也没有对生成的依存弧序列进行编码...
关键词:依存句法分析 多特征融合编码 依存子树 TreeLSTM神经网络 
融合时态特征的日英层次短语翻译模型
《计算机与现代化》2017年第6期1-7,共7页明芳 徐金安 王楠 陈钰枫 张玉洁 
国家自然科学基金资助项目(61370130;61473294);中央高校基本科研业务费专项资金资助项目(2015JBM033);科学技术部国际科技合作计划项目(K11F100010)
针对基于层次短语翻译模型的统计机器翻译使用上下文信息有限,时态翻译质量不高的问题,提出一种融合时态特征的日英统计机器翻译方法。该方法通过引入翻译规则的时态分类约束信息,解码器可以根据每条规则的潜在时态分类,为相应时态的句...
关键词:层次短语翻译模型 时态特征 最大熵分类模型 
融合词法句法分析联合模型的树到串EBMT方法
《北京大学学报(自然科学版)》2017年第2期295-304,共10页王丹丹 徐金安 陈钰枫 张玉洁 杨晓晖 
国家自然科学基金(61370130;61473294);中央高校基本科研业务费专项资金(2014RC040);科学技术部国际科技合作计划(K11F100010)资助
针对传统的基于实例的机器翻译(EBMT)方法中系统构筑复杂度和成本较高的问题,提出一种基于依存树到串的汉英实例机器翻译方法。与传统方法相比,该方法只需进行源语言端的句法结构分析,可以大大降低构筑系统的复杂度,有效降低成本。为了...
关键词:基于实例的机器翻译 依存树到串模型 联合模型 泛化模板 
融合语态特征的日英层次短语翻译模型被引量:2
《北京大学学报(自然科学版)》2017年第2期305-313,共9页王楠 徐金安 明芳 陈钰枫 张玉洁 
国家自然科学基金(61370130;61473294);中央高校基本科研业务费专项资金(2014RC040);科学技术部国际科技合作计划(K11F100010)资助
针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题,提出融合语态特征的最大熵翻译模型。首先从日语端分出被动语态、可能语态和其他语态,然后从英语端对被动和可能语态进一步分类,抽取双语特征训练最大熵规则分类模型...
关键词:被动语态 可能语态 统计机器翻译 最大熵模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部