检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赵政廷[1] 柴明熲[1] ZHAO Zhengting;CHAI Mingjiong(Graduate Institute of Interpretation and Translation,Shanghai International Studies University,Shanghai 200083,China)
机构地区:[1]上海外国语大学高级翻译学院,上海200083
出 处:《上海理工大学学报(社会科学版)》2024年第5期403-412,共10页Journal of University of Shanghai for Science and Technology:Social Sciences Edition
基 金:上海外国语大学校级规划项目(2021114015);上海外国语大学专项课题(2022zxkt22)。
摘 要:翻译教学中基于平行文本的双语平行语料库建设,本质上是译者根据自身需求进行方案设计、语料收集和语料管理的过程。目前受限于现有翻译技术手段和经济条件,翻译教学中难以规模化建设此类语料库。通过以大数据自动化采集的方式,引入人工智能领域的Python技术与PostgreSQL数据库系统,来解决目前建立大规模教学语料库的难题。为了完整呈现规模化建库过程,借用政府公文类翻译的真实案例,详细描述了建库方案设计、语料收集和语料管理等操作步骤,分析了各步骤中存在的自动化难题以及新技术介入的契机。部分技术细节与源代码也在文中公开,以期为大规模建设教学语料库提供一个切实可行的解决方案。In translation teaching,students regularly prepare“parallel texts”for a new translation project and build these linguistic materials into database,or a reference corpus.This corpus requires a relative high volume of data in order to be effective due to no ideal solution provided by available product/serviceoriented translation technology.This article aims at this scalability challenge and introduces an interdisciplinary approach by combining Python and PostgreSQL.The automation challenges in processes like corpus design,data collection and corpus management are addressed by applying these technologies.The entire large-scale corpus building process is presented in detail with relevant Python and PostgreSQL source code disclosed.
关 键 词:翻译教学语料库 规模化建设 Python应用 大数据
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] H059[自动化与计算机技术—控制科学与工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222