中国科学院西部行动计划项目(KGZD-EW-501)

作品数:5被引量:27H指数:4
导出分析报告
相关作者:米成刚杨雅婷周喜李晓周玉更多>>
相关机构:中国科学院大学中国科学院新疆理化技术研究所中国科学院自动化研究所更多>>
相关期刊:《中文信息学报》《北京大学学报(自然科学版)》《计算机应用与软件》《计算机应用研究》更多>>
相关主题:机器翻译维吾尔语最大熵逻辑语义关系篇章结构分析更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-5
视图:
排序:
维吾尔语数词类命名实体的识别与翻译被引量:6
《计算机应用与软件》2015年第8期64-67,109,共5页张磊 杨雅婷 米成刚 李晓 
中国科学院战略性先导科技专项项目(XDA06030400);中国科学院"西部之光"人才培养计划"西部博士"项目(XBBS201216);新疆维吾尔自治区青年科技创新人才培养工程项目(2013731021);中国科学院西部行动计划项目(KGZD-EW-501)
针对维吾尔语数词类命名实体(时间、日期、货币、百分比)在维汉机器翻译中翻译不准确的问题,分析其构成规律及边界信息,设计基于维汉平行语料的维吾尔语数词类命名实体的识别与翻译系统。通过有限自动机结合触发词识别并翻译维语基本数...
关键词:平行语料 数词类 命名实体 维汉机器翻译 有限自动机 
泛化语言模型在汉维机器翻译中的应用被引量:4
《计算机应用研究》2014年第10期2994-2997,共4页李响 南江 杨雅婷 周喜 米成刚 
中国科学院战略性先导科技专项基金资助项目(XDA06030400);中国科学院“西部之光”人才培养计划“西部博士”基金资助项目(XBBS201216);中国科学院西部行动计划资助项目(KGZD-EW-501)
针对汉维统计机器翻译中维吾尔语具有长距离依赖问题和语言模型具有数据稀疏现象,提出了一种基于泛化的维吾尔语语言模型。该模型借助维吾尔语语言模型的训练过程中生成的文本,结合字符串相似度算法,取相似的维文字符串经过归一化处理...
关键词:汉维机器翻译 泛化语言模型 字符串相似度算法 归一化处理 规则 译文评分 
基于最大熵的汉语篇章结构自动分析方法被引量:9
《北京大学学报(自然科学版)》2014年第1期125-132,共8页涂眉 周玉 宗成庆 
国家自然科学基金(61003160);863计划(2011AA01A207);中国科学院西部行动计划(KGZD-EW-501)资助
在标有复句逻辑语义关系的清华汉语树库上,研究汉语篇章语义片段自动切分以及篇章关系的自动标注方法。通过比较不同序列标注模型对汉语篇章语义单元切分的性能,提出基于最大熵模型的汉语篇章结构分析方法。实验结果表明,篇章语义单元...
关键词:语义片段自动切分 篇章结构分析 逻辑语义关系 树库 
基于粘着性模糊规则的维汉机器翻译最大熵调序研究被引量:2
《计算机应用研究》2013年第9期2587-2590,2605,共5页陈科海 周喜 杨雅婷 米成刚 
中国科学院战略性先导科技专项资助项目(XDA06030400);中国科学院"西部之光"人才培养计划西部博士资助项目(XBBS201216);中国科学院西部行动计划项目(KGZD-EW-501)
针对维汉机器翻译中未登录词和译文乱序问题严重的现象,结合维吾尔语粘着性语言特点以及最大熵分类算法,提出了一种基于粘着性模糊规则的维汉机器翻译最大熵调序模型。该模型以最大熵模型为基础,在维吾尔语词级别构建粘着性规则约束,从...
关键词:维汉机器翻译 形态学 粘着性 模糊规则 最大熵 调序模型 
基于字符串相似度的维吾尔语中汉语借词识别被引量:6
《中文信息学报》2013年第5期173-178,190,共7页米成刚 杨雅婷 周喜 李晓 杨明忠 
中国科学院战略性先导科技专项(XDA06030400);中国科学院"西部之光"人才培养计划"西部博士资助项目"(XBBS201216);中国科学院西部行动计划资助项目(KGZD-EW-501)
维汉机器翻译过程中会出现较多的未登录词,这些未登录词一部分属于借词(人名、地名等)。该文提出一种新颖的根据借词与原语言词发音相似这一特性进行维吾尔语中汉语借词识别的方法。该方法对已有语料进行训练,得到面向维吾尔语中汉语借...
关键词:借词 未登录词 发音相似度 字符串相似度 
检索报告 对象比较 聚类工具 使用帮助 返回顶部