双语对齐

作品数:24被引量:135H指数:6
导出分析报告
相关领域:语言文字自动化与计算机技术更多>>
相关作者:陈博兴常宝宝杜利民黄书剑陈家骏更多>>
相关机构:南京大学北京大学大连理工大学中国科学院更多>>
相关期刊:《浙江警察学院学报》《现代电子技术》《语料库语言学》《外语电化教学》更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划教育部人文社会科学重点研究基地度重大研究项目国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于强化学习的古今汉语句子对齐研究
《中文信息学报》2024年第12期30-38,63,共10页喻快 邵艳秋 李炜 
国家自然科学基金(61872402);教育部人文社科规划基金(17YJAZH068);北京语言大学校级项目(中央高校基本科研业务费专项基金)(21YBB19,18ZDJ03);模式识别国家重点实验室开放课题基金。
基于深度学习的有监督机器翻译取得了良好的效果,但训练需要大量高质量的对齐语料。对于中文古今翻译场景,高质量的平行语料相对匮乏,这使得语料对齐在该领域具有重要的研究价值和必要性。在传统双语平行语料的句子对齐研究中,传统方法...
关键词:双语对齐 预训练语言模型 强化学习 动态规划 
融合敏感词典和异构图的汉泰跨语言敏感信息识别
《计算机工程与设计》2024年第7期2150-2156,共7页朱栩冉 余正涛 张勇丙 
国家自然科学基金项目(U21B2027、61972186、62266028);云南省重大科技专项计划基金项目(202202AD080003)。
通用跨语言文本分类模型识别毒品、暴力和自然灾害等敏感信息不准确,且汉泰双语敏感词表示多样化、难对齐导致不同语言信息聚合能力较弱,为此提出一种融合敏感词典和异构图的汉泰跨语言敏感信息识别方法。利用汉泰敏感词典构建具有文档...
关键词:敏感词典 跨语言 异构图 图卷积神经网络 敏感信息识别 多语言预训练模型 双语对齐 
汉英双语句对齐反思与展望
《解放军外国语学院学报》2023年第6期70-78,156,共10页邢富坤 
国家社会科学基金项目“汉英小句级对齐语料库的研制与应用研究”(19BYY081)。
双语对齐是开展语言对比和机器翻译研究的重要前提,目前双语对齐研究主要集中在对齐算法和模型优化上,缺少面向双语对齐的语言特征研究。本文在总结已有汉英双语句对齐工作的基础上,提出双语句对齐需满足的3个条件,并指出以句号句为单...
关键词:汉英 双语对齐 句对齐 语料库 自动对齐 
双语对齐工具应用性对比研究被引量:1
《洛阳师范学院学报》2022年第10期82-86,共5页黄旦华 
教育部产学合作协同育人项目(202102483011),浙江省“十三五”省级产学合作协同育人项目(浙教办函〔2019〕365)。
研究选取国内外的6种不同双语对齐工具,通过实验对法律、政治、演讲三种中英双语文本进行对齐比较,分析了不同工具的优缺点。研究发现,整体而言Tmxmall和ABBYY Aligner在对齐的准确率上要优于其他的工具。ABBYY Aligner使用无需网络,更...
关键词:翻译记忆 双语对齐 对齐工具 对齐准确率 
基于汉语标点句的汉英双语对齐语料库构建及对齐语序分析被引量:1
《语料库语言学》2021年第2期136-147,共12页邢富坤 孙晓迪 
国家社会科学基金项目“汉英小句级对齐语料库研制与应用研究”(19BYY081);山东省高等学校“青创科技计划”的阶段性成果
双语句对齐语料库是机器翻译、机辅翻译和语言对比研究的重要资源。汉英对齐一般使用汉语句号句作为对齐单位,但由于汉语句号使用的灵活性,使得汉语句号句与英文句子不具有完全对等性,对汉英对齐效果产生较大影响。本研究将汉语标点句...
关键词:汉语标点句 汉英双语语料库 对齐语序 
北京大学CCL语料库的研制被引量:44
《语料库语言学》2019年第1期71-86,116,共17页詹卫东 郭锐 常宝宝 谌贻荣 陈龙 
2015年度教育部人文社科重点研究基地重大项目(15JJD740002)的支持
北京大学中国语言学研究中心CCL语料库是面向语言学本体研究和语言教学的大规模语料库,目前包括现代汉语、古代汉语和汉英句对齐平行语料,规模超过7亿汉字。CCL语料库检索系统以包括汉字、字母、标点等在内的字符为基本索引单位,提供普...
关键词:北大CCL语料库 汉英双语对齐语料 语料检索 语料索引 
翻译记忆库编纂中的双语对齐问题及对策被引量:2
《海外英语》2018年第6期124-126,共3页杜玫锦 卢华国 
该文主要是通过分析气象记忆库编纂过程中双语对齐碰到的问题及对策,来说明高质量记忆库在翻译过程的重要作用。该文虽然以ABBYY Aligner使用为例,总结了记忆库编纂中双语对齐在结构、内容、符号三方面存在的不足,并提出了具体的解决方...
关键词:计算机辅助翻译 记忆库 双语对齐 
警务翻译平行语料库的设计和构建被引量:3
《浙江警察学院学报》2016年第5期95-99,共5页丁皓 
以语料库为基础的计算机辅助翻译(CAT)模式是提高涉外警务翻译能力的一个有效手段,而CAT的前提是警务翻译语料库建设。警务翻译平行语料库的设计和构建,可以从分析警务专业用语涉及的范围入手。警务翻译平行语料库的设计应包含语料库二...
关键词:警务翻译语料库 设计 构建 双语对齐 语料噪音 语料标注 
基于双语对齐的汉语–新蒙古文命名实体翻译被引量:4
《北京大学学报(自然科学版)》2016年第1期148-154,共7页杨萍 侯宏旭 蒋玉鹏 申志鹏 杜健 
国家自然科学基金(61362028)资助
汉语–新蒙古文命名实体翻译在跨汉语–新蒙古文信息处理中具有重要意义,而直接使用机器翻译的方法不能达到满意的结果。针对上述问题,提出一种从汉语–新蒙古文平行语料中自动抽取汉语–新蒙古文命名实体翻译对的方法。该方法只需对汉...
关键词:命名实体 识别 翻译 双语对齐 
基于Halliday同义词库法的翻译过程研究——双语对齐研究的启示
《乐山师范学院学报》2015年第10期48-51,共4页王晓峰 
韩礼德(Halliday.M.A.K)在研究机器翻译的过程中所提出的翻译过程思想在当时的语言学界起到了较大的影响。文章从语块对齐入手,介绍并分析了目前语块对齐的基本方法,及其由于对语言学知识的缺失而产生的问题。在此基础上,结合阶与范畴...
关键词:翻译过程 同义词库法 机器翻译 双语对齐 
检索报告 对象比较 聚类工具 使用帮助 返回顶部