检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘晨璇[1,2] 王吟颖 李小喜 戴礼荣 LIU Chenxuan;WANG Yinying;LI Xiaoxi;DAI Lirong(University of Science and Technology of China,Hefei,China;Shanghai International Studies University,Shanghai,China;iFLYTEK Research,Hefei,China)
机构地区:[1]中国科学技术大学 [2]科大讯飞人工智能研究院 [3]上海外国语大学
出 处:《中国翻译》2023年第3期71-80,190,共11页Chinese Translators Journal
基 金:国家社科基金项目“‘一带一路’背景下以中文为轴心语言的口笔译路径研究”(项目编号:20BYY030);上海市脑机协同信息行为重点实验室课题“远程工作模式下同声传译员的压力管理”(课题批准号:2021KFKT003)的阶段性研究成果。
摘 要:教学语料设计是口译教学的重要组成部分。学界对口译教材建设的现状和语料难度影响因素有一定的研究,但影响难度的变量众多且关系复杂,难度划分主要依赖于专家经验,缺乏统一、可靠的分级标准。从机器学习的角度看,教学语料的难度分级可视为一个分类问题。本文使用RoBERTa预训练模型构建神经网络系统,通过对286段语料进行人工标注再使用数据增强和知识蒸馏技术扩充数据集的方法,开发了一套基于机器学习的教学语料难度自动分级系统。该系统可以根据输入的源语语料自动输出其难度分级结果,帮助教师和学习者更好地开展课堂教学和自主学习。Speech difficulty level of materials for training interpreters is dependent on a myriad of complicated factors.While the established practice for determining the level is to rely on expert trainers'opinions so far,what is involved is actually a pattern-cognition problem solvable by using machine learning.In this paper,we propose a neural network architecture for automatically determining the level of speech difficulty in this context.Based on the RoBERTa pre-training model,our system was trained using 286 tagged data points and additional training sets generated through knowledge distilling and data augmentation.Its application promises to lend much help to trainers and students of interpreting in their efforts to select suitable training materials for classroom activities and after-class practice.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249