语料库构建

作品数:158被引量:609H指数:12
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:李培培胡学钢关毅昝红英张坤丽更多>>
相关机构:哈尔滨工业大学苏州大学昆明理工大学合肥工业大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
高考英语读后续写主题语料库构建的价值和应用策略
《英语教师》2025年第8期13-18,共6页严馨 
江苏省中小学教学研究第十四期立项课题“文化-文明传统中英语读后续写支持性策略研究”(课题编号:2021JY14-L40)的阶段研究成果。
分析高考英语读后续写主题语料库构建的价值,即关注主题意义,培养学生自主、探究式学习资源构建;重视现代信息技术应用,拓展学习渠道等。探究高考英语读后续写主题语料库构建及应用策略,即以课程内容三大主题语境为引领,明确语料库构建...
关键词:读后续写 高考英语 主题意义 语料库 
采煤机多语种语料库构建的可行性分析
《煤炭技术》2025年第3期262-264,共3页陶嵘 
中煤科工集团上海有限公司科研开发项目(02090128823Y)。
煤机行业正逐渐走向国际化,需要提高沟通效率,确保技术文档的准确性和专业性。通过对TRADOS核心功能和采煤机技术特点的研究,分析构建采煤机语料库的可行性,为矿业设备翻译工作提供新的视角和解决方案。
关键词:采煤机语料库 TRADOS 可行性 
汉蒙双语法律领域问答语料数据集
《中国科学数据(中英文网络版)》2024年第4期76-84,共9页朝木尔力格 王斯日古楞 
内蒙古自治区科技计划(2021GG0139);内蒙古自然科学基金(2022MS06002);内蒙古自然科学基金(2024LHMS06024)。
随着大模型技术的发展,智能问答在人们的工作和生活中的应用越来越广。但是受数据资源的限制,蒙古文等低资源语言的智能问答系统还无法满足人们的应用需求。本研究采用了现有的中文问答语料,经过规则筛选、汉蒙翻译和人工校正的步骤,构...
关键词:汉蒙双语 法律问答语料 语料库构建 语料校正 
基于AntConc的广西外宣话语汉英语料库构建及安全防护机制研究
《中文科技期刊数据库(文摘版)社会科学》2024年第12期005-008,共4页李丽 马力 
广西高校中青年教师科研基础能力提升项目“广西乡村振兴背景下外宣话语汉英语料库建设研究”(No.2023KY1756)。
在全球化背景下,广西作为中国与东盟的前沿区域,其外宣话语在传播地方声音和展示区域形象方面扮演着重要角色。本研究基于AntConc工具,探讨了广西外宣话语汉英语料库的构建方法及其安全防护机制。研究首先概述了外宣话语与语料库研究的...
关键词:外宣话语 语料库构建 AntConc工具 数据安全防护 
档案数据化背景下面向专题的档案语料库构建探析——以抗美援朝档案为例
《档案天地》2024年第12期39-42,共4页李石 
2024年辽宁省教育厅高校基本科研项目“数据要素化背景下数字档案资源知识组织与开放利用研究”(LJ112410140076)。
《“十四五”全国档案事业发展规划》指出:“新一代信息技术广泛应用,档案工作环境、对象、内容发生巨大变化,迫切要求创新档案工作理念、方法、模式,加快全面数字转型和智能升级。”~([1])党的十九届四中全会首次提出将数据作为生产要...
关键词:档案数据 数字转型 新一代信息技术 档案事业发展 语料库 智能升级 抗美援朝档案 构建探析 
一种灵活高效的增量式Web平行语料抽取方法
《计算机科学》2024年第11期248-254,共7页刘小峰 郑禹铖 李东阳 
从Web中抽取平行语料对于机器翻译和其他多语语言处理任务来说非常重要,由此提出了一种从Web中灵活高效地增量抽取平行语料的方法,通过持续地对Common Crawl的Web抓取存档进行下载、扫描和分析统计,增量更新域名下的语言文本长度统计数...
关键词:平行语料抽取 句子对齐 语料库构建 机器翻译 WEB挖掘 
思想政治教育人工智能大模型语料库构建的问题审视和实践路径被引量:1
《绍兴文理学院学报》2024年第10期37-47,共11页沈强 
安徽省职业与成人教育学会项目“高职思政课教学方法研究——对错误思潮批判考察为例”(Azcj2022220);芜湖职业技术学院项目“算法推荐嵌入高校思政课实践教学基地数字智能化的逻辑机理与实践路径研究”(wzyrw202227)。
ChatGPT类人工智能大模型重塑了传统的内容生产方式与信息传播模式,在数据、内容、伦理、意识等层面给思想政治教育带来了数据遮蔽与技术异化、内容虚构与信息疫情、隐私侵犯与主体弱化、意识幻象与话语失真等问题困境。语料数据的体量...
关键词:思想政治教育 人工智能 大模型 语料库 路径 
恐怖袭击事件实体语料库构建
《现代信息科技》2024年第19期44-47,52,共5页李林瑛 王孙和 曲云平 
2022年辽宁省研究生教育教学改革研究项目(LNYJG2022423);辽宁省教育厅高等学校基本科研项目(LJKMZ20221549)。
针对恐怖袭击事件文本语料库匮乏的问题,文章制定了恐怖袭击事件的实体标注规范,通过对全球恐怖主义数据库(GTD)的数据进行实体标注,构建了恐怖袭击事件的实体语料库。同时,针对数据标注工作的高人力和高时间成本问题,由于百度通用信息...
关键词:恐怖袭击事件 实体语料库 通用信息抽取 全球恐怖主义数据库 命名实体识别 
秦腔汉英多模态双语平行语料库构建及英译上口性研究被引量:1
《西安文理学院学报(社会科学版)》2024年第3期105-111,共7页李庆明 王丹妮 
国家社科基金项目:传统秦腔汉英多模态双语语料库构建与英译研究(21BYY119)。
秦腔是中国最古老的戏曲之一,集“唱念做打”于一体,秦腔表演蕴含着丰富的语言、唱腔、音乐、角色、服饰等多种文化内涵,具有多模态性。上口性是戏剧翻译的显著特征,秦腔戏曲唱词大多具有诗歌的音韵美,富有节奏,对白简练、干脆。基于作...
关键词:秦腔《关西夫子》 戏曲翻译 上口性 
卫星领域语料库构建与命名实体识别
《国防科技大学学报》2024年第4期175-183,共9页徐聪 石会鹏 陈志敏 张鑫宇 王静 杨甲森 
中国科学院复杂航天系统电子信息技术重点实验室择优基金资助项目(Y42613A32S)。
针对卫星领域命名实体语料匮乏、现有算法识别性能较低的问题,提出一种考虑模糊边界的卫星领域实体标注方法,构建包含8类常见卫星领域实体的语料库,与该领域现有语料库相比粒度更细、覆盖更广,并以此为基础提出迁移学习和多网络融合的...
关键词:命名实体识别 迁移学习 神经网络 数据稀缺 
检索报告 对象比较 聚类工具 使用帮助 返回顶部