多语

作品数:1524被引量:2458H指数:19
导出分析报告
相关领域:语言文字文化科学更多>>
相关作者:余正涛赵铁军李燕萍高盛祥杨沐昀更多>>
相关机构:北京外国语大学上海外国语大学云南师范大学新疆大学更多>>
相关期刊:更多>>
相关基金:国家社会科学基金国家自然科学基金教育部人文社会科学研究基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-10
视图:
排序:
Lacmia:抗混淆的多民族语言生成式摘要模型
《中文信息学报》2024年第10期80-94,共15页翁彧 罗皓予 刘征 超木日力格 刘轩 董俊 
国家重点研究与发展计划(2020YFB1406702-3);北京市科技计划项目(Z231100001723002);国家自然科学基金(62006257)。
该文提出了一种针对中国多民族低资源语言生成式摘要模型Lacmia(Language-Anti-confusioned Chinese Minority Abstractive Summarization Model)。为了克服以往模型只能处理单一语言的限制,Lacmia采用了一种统一的生成式架构来执行不...
关键词:生成式摘要 多语言预训练模型 低资源语言信息处理 多目标学习 
基于域对抗迁移学习的低资源机器翻译
《中文信息学报》2024年第6期77-85,共9页常鑫 侯宏旭 乌尼尔 贾晓宁 李浩然 
内蒙古自治区科技成果转化专项(2019CG028);内蒙古自然科学基金(2018MS06005,14020202-0114)。
当域外和域内分别表示不同的语言时,语言之间的差异会导致域外知识难以适应至域内。因此提出域对抗迁移学习方法来改进机器翻译模型。采用对抗学习方法,加入一个域判别器对域外和域内的语义特征进行预测,通过最小化域外和域内语义特征...
关键词:对抗 机器翻译 多语言 对抗学习 
基于多特征融合与多语言预训练的藏文文本分类被引量:1
《中文信息学报》2023年第12期54-61,共8页胥桂仙 陈哲 马慧麟 
国家社会科学基金(19BGL241)。
针对藏文数据集稀少的问题,该文对TNCC数据集进行了数据增强,提出了基于少数民族语言预训练模型(CINO)、TextCNN和双向长短时记忆网络(BiLSTM)的多特征融合与多语言预训练的藏文文本分类模型(MFMLP)。模型将数据集的文本分词输入到CINO...
关键词:多特征融合 多语言预训练 藏文文本分类 
中英双语政治论辩挖掘任务数据集建设
《中文信息学报》2023年第10期167-174,共8页张霄军 周静狮 
西交利物浦大学科研发展基金(RDF-22-01-053);广东省安全智能新技术重点实验室开放课题基金(2022B1212010005)。
受制于训练语料资源稀缺,中文论辩挖掘在政治领域的研究才刚刚起步。外交辞令、外事问答以及外宣公告都蕴含着丰富而微妙的政治论辩技巧,在外交领域开展政治论辩挖掘研究具有现实意义和应用价值。该文从在建的“多语外交对话语料库”得...
关键词:政治论辩 多语外交对话语料库 跨语言论辩挖掘 论辩挖掘任务数据集 
基于ERNIE-BiGRU模型的摘要语步自动识别研究被引量:4
《中文信息学报》2022年第11期91-100,共10页温浩 何茜茹 王杰 乔晓东 张鹏 
国家自然科学基金(71673213)。
学术文献的摘要是对文献主要内容的浓缩,摘要不同部分的语步具有不同的信息,语步的自动识别和抽取对于学术摘要的后续研究有着重要的应用价值,而目前语步识别的研究相对较少,并且相关算法的效果还需要提高。针对上述问题,该文提出了一...
关键词:中文句法分析 多语步结构拆分 ERNIE-BiGRU模型 
多语种网络文本快速新词抽取被引量:2
《中文信息学报》2014年第2期78-84,共7页刘冰洋 刘倩 张瑾 刘欣然 程学旗 
国家自然科学基金(609933005;60903139);国家242专项(2011A001;2012G129);973项目(2013CB329601)
从网络文本中提取新词是网络信息处理中的一个重要问题,在信息检索、文本挖掘、词典编纂、中文分词等领域中都有重要应用。本文提出了一种与语言无关的快速新词提取算法,首先针对后缀树的数据结构将多语言文本进行统一编码,然后使用改...
关键词:新词 邻接类别 字符串整体度 后缀树 多语言 
以机器翻译技术为核心的多语信息处理研究被引量:2
《中文信息学报》2011年第6期81-89,110,共10页赵铁军 曹海龙 
国家自然科学基金重点项目(60736014;60736044);国家自然科学基金面上项目(60773066;60773069;61173073);国家863计划重点项目(2006AA010108);国家863计划探索类项目(2006AA01Z150)
该文介绍了哈尔滨工业大学教育部—微软语言语音重点实验室在多语信息处理方面的研究进展和成果。首先综述了国内外的研究现状,然后重点介绍在统计机器翻译、机器翻译应用、机器翻译评价、跨语言信息检索等方面的研究工作。
关键词:机器翻译 多语信息处理 自然语言处理 
面向多语言的机器翻译支撑环境设计与实现被引量:2
《中文信息学报》2004年第3期9-16,共8页魏勇鹏 陈群秀 
在日汉机器翻译系统由DOS移植到Windows环境后 ,针对进一步扩充资源和调试开发过程中遇到的词典管理不便、工具使用麻烦、翻译及编辑界面不友好、日志维护不完善等问题 ,我们开发了面向多语言的机器翻译支撑环境子系统。该子系统实现了...
关键词:人工智能 机器翻译 支撑环境 多语言 
时间语义层次结构及理解被引量:2
《中文信息学报》1997年第1期11-19,共9页郭宏蕾 姚天顺 
在自然语言处理中,时间是一个重要的语境因素,为了真实反映并准确理解文本中的各级时间语境,本文提出了一种多层次时间语义表达结构,浅层语义结构是时间描述的量化表示,深层语义结构描述时间语境的动态时间属性和事件在给定时区内...
关键词:自然语言处理 多语翻译 时间语义结构 时间语境 
多语种(英法俄德日汉)数词的自动翻译被引量:1
《中文信息学报》1989年第1期30-39,共10页李竹 
本文介绍了一个多语种(英法俄德日汉)数词的自动翻译系统,探讨了不同语言间数词系统的共性与差异,证明了媒介语方法在机器翻译中的可行性。数的概念和具体的数都具有普遍性,而每一种语言都具有自己的数词系统。不同语言间数词的共性是...
关键词:英法 媒介语 德日 多语 后缀式 综合过程 mille 算法构造 二元组 二十进制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部