词对齐

作品数:58被引量:162H指数:6
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:黄书剑宗成庆陈家骏戴新宇赵铁军更多>>
相关机构:南京大学哈尔滨工业大学昆明理工大学东北大学更多>>
相关期刊:《智能计算机与应用》《现代电子技术》《外语电化教学》《计算机应用与软件》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家科技支撑计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
大语言模型多语言词对齐能力评测方法
《西南民族大学学报(自然科学版)》2024年第6期681-688,共8页李洁 李正芳 邹垚 熊大卫 胡建 
国家社会科学基金重大招标项目(19ZDA284);西南民族大学研究生创新型科研项目(YCYB2024005)。
针对目前大语言模型多语言词对齐能力评测相对缺乏的问题,提出一种通过跨语言选词填空任务评测其多语言词对齐能力的方法:根据词汇的上下文长短、词性、干扰词数量等规则生成多维度的跨语言选词填空评测数据集,并用其对多种大语言模型...
关键词:大语言模型 多语言词对齐能力评测 跨语言选词填空 
融入线性句法信息的神经网络双语词对齐算法
《计算机应用与软件》2023年第9期278-282,319,共6页尹宝生 张斌斌 李绍鸣 
国防技术基础项目(JSQB2017206C002)。
目前的双语词对齐模型主要依赖大量人工标注语料,不仅耗费时间成本并且人工标注质量不稳定,为了解决这一问题,提出一种基于双语句对齐语料构建双语词对齐神经网络模型的方法。使用GIZA++进行双语词对齐,设计标注方案,生成双语词对齐语料...
关键词:线性句法 词对齐 神经网络 
基于多译本平行语料库的英汉智能翻译系统设计
《自动化与仪器仪表》2023年第1期157-161,共5页冯掬琳 王彦裕 
陕西省哲学社会科学重大理论与现实问题研究项目《英国小说讽刺手法的政治维度与寓意研究》(2022ND0479)。
为了提高传统翻译系统翻译质量,提出一种基于多译本平行语料库的英汉智能翻译系统。为实现该系统,首先采用网络爬虫算法对英汉语料进行收集和预处理,搭建出多译本平行语料库;然后采用基于上下文向量的词对齐模型和基于余弦相似度计算方...
关键词:智能翻译系统 平行语料库 网络爬虫 词对齐 段落对齐 
基于对抗网络的文本对齐跨语言情感分类方法被引量:1
《数据分析与知识发现》2022年第7期141-151,共11页杨文丽 李娜娜 
国家自然科学青年基金项目(项目编号:61806072)的研究成果之一。
【目的】通过拉近共享空间中双语文本对的分布以提高跨语言情感分类的准确率。【方法】在情感知识迁移过程中,通过调整平衡系数同时对齐词对和文本对,并联合语言判别器生成对抗网络优化转换矩阵。此外,采用一种多特征融合的分层神经网...
关键词:词对齐 文本对齐 生成对抗网络 多特征融合 分层神经网络 
使用词对齐半监督对抗学习的汉越跨语言摘要生成方法被引量:4
《小型微型计算机系统》2022年第5期992-997,共6页王剑 张莹 余正涛 黄于欣 
国家重点研发计划项目(2018YFC0830105,2018YFC0830101,2018YFC0830100)资助;国家自然科学基金项目(61972186,61762056,61472168)资助;云南省重大科技专项计划项目(202002AD080001)资助;云南省高新技术产业专项(201606)资助。
是将输入的源语言文本生成目标语言摘要的过程.目前跨语言摘要任务大多是借助于机器翻译,而针对越南语这类低资源语言,机器翻译效果不佳是汉越跨语言摘要面临的挑战.针对该问题,提出了一种基于词对齐的半监督对抗学习汉越跨语言摘要生...
关键词:跨语言摘要 Bert 半监督对抗学习 词对齐 
基于Spark的大规模机器翻译系统研究被引量:3
《自动化与仪器仪表》2022年第3期73-77,共5页赵崇俊 
陕西省教育科学“十三五”规划2020年度课题,大学英语教学《指南》视域下教师隐性课程研究(SGH20Y1243);陕西省体育局科研常规课题,奥运会全运会视域下城市竞技赛事语言环境建设研究,课题号:2021249;陕西省哲学社会科学重大理论与现实问题研究重点项目,“一带一路”背景下师范类高校大学英语精品教材资源建设研究(2021HZ-842)。
为提高大规模机器翻译准确率和翻译效率,基于EM分布式训练方法,提出基于Spark的大规模机器翻译方法。首先,在机器翻译模型的基础上对并行化训练方法和机器翻译系统框架进行分析,然后提出EM分布式并行算法和框架,针对短语翻译模型和层次...
关键词:机器翻译 词对齐 SPARK 大规模训练 并行化算法 
基于词对齐的古汉语同义词自动抽取研究——以前四史典籍为例被引量:4
《数据分析与知识发现》2021年第11期135-144,共10页纪有书 王东波 黄水清 
国家社会科学基金重大项目(项目编号:15ZDB127);国家自然科学基金面上项目(项目编号:71673143)的研究成果之一。
【目的】针对古汉语领域同义词自动抽取研究较少以及现代汉语同义词抽取方法在古汉语不适用的问题,提出一种无监督抽取古汉语同义词的方法。【方法】构建句子级别古白对齐语料,利用词对齐算法实现典籍语料的词对齐,根据词对齐结果设计...
关键词:同义词 词对齐 古汉语典籍 数字人文 
基于领域自适应方法的统计机器翻译模型的优化研究被引量:2
《科学技术创新》2021年第5期82-83,共2页杨玲 
本文引入领域自适应这一方法,对现有的统计机器翻译词对齐方法进行改进,其中主要过程是首先运用最大熵分类器方法对大规模双语平行语料进行筛选,再通过LDA模型对双语平行语料进行主题提取,然后训练每个主题对应的词对齐模型,进而得到翻...
关键词:词对齐 领域自适应 统计机器翻译 
融合语言知识与深度学习的文本蕴含识别被引量:1
《计算机工程与应用》2020年第24期157-163,共7页郑德权 于凤 王贺伟 
黑龙江省自然科学基金(No.F2017020);国家重点研发计划(No.2017YFB1002102)。
文本蕴含技术在自然语言处理中得到了广泛应用,但存在词对推理能力差的问题(例如,句对中出现反义词对无法判断反义关系等)。重点研究了词对知识向量的获取问题,包括融合多特征及有监督的词对关系向量获取、采用TransR的词对关系表示获...
关键词:文本蕴含 知识向量 深度学习 词对齐 注意力机制 
利用上下文相似度增强词对齐效果的自然语言推理方法被引量:2
《智能科学与技术学报》2020年第1期26-35,共10页杜倩龙 宗成庆 苏克毅 
国家重点研发计划基金资助项目(No.2017YFB1002103)。
当前的自然语言推理方法在进行词对齐时往往只关注如何利用上下文信息改善词汇的表示,而忽略了上下文相似度对词汇对齐的帮助。推理方法在融合局部判定信息进行结果预测时,通常赋予局部判定信息相同的权重,而实际上不同词汇对应的局部...
关键词:文本蕴含 自然语言推理 词对齐 
检索报告 对象比较 聚类工具 使用帮助 返回顶部