国家科技支撑计划(2012BAH14F03)

作品数:12被引量:58H指数:4
导出分析报告
相关作者:史晓东陈毅东苏劲松胡金铭罗凌更多>>
相关机构:厦门大学更多>>
相关期刊:《北京大学学报(自然科学版)》《软件学报》《智能系统学报》《电脑知识与技术》更多>>
相关主题:复述统计机器翻译神经网络机器翻译翻译模型更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于增量式自学习策略的多语言翻译模型被引量:6
《厦门大学学报(自然科学版)》2019年第2期170-175,共6页周张萍 黄荣城 王博立 胡金铭 史晓东 陈毅东 
国家科技支撑计划项目(2012BAH14F03);国家自然科学基金(61573294);教育部博士点基金(20130121110040);国家语委委托项目(WT135-10);国家语委甲骨文专项(YWZ-J010)
针对源语言到目标语言缺乏平行语料的情况,提出了一种基于增量式自学习策略的多语言翻译模型,即利用中介语双语语料训练源语言到目标语言的翻译模型.在Transformer架构下,相比于基于中介语和直接在伪平行语料上训练的普通双语翻译模型,...
关键词:神经网络机器翻译 多语言机器翻译 增量式自学习 
一种基于循环神经网络的古文断句方法被引量:24
《北京大学学报(自然科学版)》2017年第2期255-261,共7页王博立 史晓东 苏劲松 
教育部专项"简繁汉字智能转换系统";教育部博士点基金(20130121110040);国家科技支撑计划项目(2012BAH14F03);国家自然科学基金(61573294);CCF中文信息技术开放课题(CCF2015-01-01)资助
提出一种基于循环神经网络的古文自动断句方法。该方法采用基于GRU(gated recurrent unit)的双向循环神经网络进行古文断句。在解码过程中,该算法不仅利用神经网络输出的概率分布,还进一步引入状态转移概率和长度惩罚,以便提高断句准确...
关键词:古汉语 断句 循环神经网络 
基于特征自动选择方法的汉语隐喻计算被引量:2
《厦门大学学报(自然科学版)》2016年第3期406-412,共7页曾华琳 周昌乐 陈毅东 史晓东 
国家自然科学基金(61573294);国家科技支撑计划(2012BAH14F03);教育部博士学科点基金博导类项目(20130121110040)
汉语隐喻计算是中文信息处理中的棘手难题之一.已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强、难以扩充的缺点,并且对于专业背景知识要求比较严格.本文基于大规模语料库的机器学习,利用最大熵分类模型,提出了一种...
关键词:汉语隐喻计算 隐喻识别 机器学习 自动特征选择 
基于树形条件随机场的跨语言时态标注被引量:1
《软件学报》2015年第12期3151-3161,共11页陈怡疆 徐海波 史晓东 苏畅 
国家自然科学基金(61075058);国家科技支撑计划(2012BAH14F03)~~
提出时态树的概念和构造方法,从而将汉英时态转换问题转换为时态树标注的问题.而后,使用树形条件随机场为未标注时态树的结点标注英语时态.提出的特征函数的模板较好地满足了模型推断的需要.实验结果表明:与基于线性条件随机场模型的时...
关键词:汉英时态转换 时态树 未标注时态树 已标注时态树 树形条件随机场 
基于复述技术的汉语成语翻译方法研究被引量:3
《中文信息学报》2015年第4期166-174,共9页罗凌 陈毅东 史晓东 苏劲松 
国家自然科学基金(61005052);国家科技支撑计划(2012BAH14F03);中央高校基本科研业务费专项资金(2010121068);福建省自然科学基金(2011J01369)
汉语成语是汉语的精华,拥有特有的语言形式,并经常出现在汉语中。但是由于汉英统计机器翻译训练语料中成语的稀疏性和现今大多机器翻译系统并没有对成语进行特殊的处理和研究,在汉英机器翻译中成语的翻译并不理想。针对该问题,本文提出...
关键词:统计机器翻译 成语翻译 复述 
语料库语言学视角下的台湾汉字简化研究被引量:3
《北京大学学报(自然科学版)》2015年第2期249-254,共6页王博立 史晓东 陈毅东 任文瑶 阎思瑶 
教育部专项"简繁汉字智能转换系统";国家科技支撑计划(2012BAH14F03);国家自然科学基金(61303082;61005052);教育部博士点基金(20130121110040)资助
采用语料库语言学的研究方法,论证台湾存在汉字简化的现象,并分析台湾汉字简化的特点和影响因素。首先,通过爬取台湾的新闻媒体、政府网站和博客,建立台湾汉语语料库。然后,借助语料库统计数据,论证台湾民间存在对简笔俗字的使用偏好,...
关键词:语料库语言学 台湾地区 汉字 汉字简化 俗字 
古典诗词动画自动生成研究被引量:5
《北京大学学报(自然科学版)》2015年第2期255-261,共7页阎思瑶 郑旭玲 史晓东 郑发魁 
国家科技支撑计划(2012BAH14F03);教育部博士点基金(20130121110040)资助
以中国古典诗词为研究对象,首次尝试将自然语言处理、计算诗学和计算机动画等相关研究成果相结合来解决古典诗词的动画自动生成。首先使用基于SVM和协同学习的分类器对古诗风格、题材以及时间进行自动判定。随后在使用Flash Actionscrip...
关键词:古典诗词 动画生成 SVM分类 共现分析 
引入基于主题复述知识的统计机器翻译模型被引量:1
《浙江大学学报(工学版)》2014年第10期1843-1849,共7页苏劲松 董槐林 陈毅东 史晓东 吴清强 
国家"十二五"科技支撑计划资助项目(2012BAH14F03);国家自然科学基金资助项目(61005052;61303082);高等学校博士学科点专项科研基金资助项目(2012012120046);福建省自然科学基金资助项目(2011J01360);厦门市科技计划资助项目(3502Z20103001);深圳市高性能数据挖掘重点实验室资助项目(CXB201005250021A)
针对传统的基于双语平行语料的复述获取方法在复述获取和应用的过程中忽视文档上下文的缺点,引入基于主题模型的上下文信息来改善复述获取—主要致力于如何计算上下文无关的复述生成概率和上下文相关的复述生成概率.研究如何将上述2种...
关键词:统计机器翻译 复述 主题模型 
引入集成学习的最大熵短语调序模型被引量:3
《中文信息学报》2014年第1期87-93,共7页何钟豪 苏劲松 史晓东 陈毅东 黄研洲 
国家自然科学基金(61303082;61005052);国家科技支撑计划(2012BAH14F03);高等学校博士学科点专项科研基金(20120121120046)
基于最大熵的括号转录语法模型具有翻译能力强、模型训练简单的优点,成为近些年统计机器翻译研究的热点。然而,该模型存在短语调序实例样本分布不平衡的缺点。针对该问题,该文提出了一种引入集成学习的短语调序模型训练方法。在大规模...
关键词:最大熵 短语调序 不平衡分类 集成学习 
微博观点句识别的话题影响研究被引量:2
《电脑知识与技术》2014年第1期123-127,共5页罗凌 陈毅东 曹茂元 
国家自然科学基金项目(61005052);国家科技支撑计划课题(2012BAH14F03);中央高校基本科研业务费专项资金(2010121068);福建省自然科学基金项目(201U01369)
为了从海量的网络信息中迅速准确地获取评价信息,观点句识别已经成了自然语言处理的一个研究热点。现在观点句识别系统大都是基于机器学习的方法,一般使用机器学习的方法来进行分类会受到领域差异性影响。针对这个问题,该文对微博观...
关键词:观点句识别 机器学习 话题 规则 
检索报告 对象比较 聚类工具 使用帮助 返回顶部