基于跨语言信息检索的可比语料库构建方法研究  被引量:1

Study on the Construction Methods of Comparable Corpus Based on Cross Language Information Retrieval

在线阅读下载全文

作  者:司莉[1,2] 史雅莉[3] 

机构地区:[1]武汉大学信息资源研究中心 [2]武汉大学信息管理学院图书馆学系 [3]武汉大学信息管理学院

出  处:《国家图书馆学刊》2016年第6期64-70,共7页Journal of The National Library of China

基  金:教育部人文社会科学重点研究基地重大项目"基于内容的多语言信息组织与检索研究"(项目编号:14JJD870001)研究成果之一

摘  要:为满足用户对多语言信息表达与获取的迫切需求,可比语料库的研究和开发逐渐成为信息检索领域研究者和系统开发人员的关注重点。从跨语言信息检索视角出发,可比语料库的构建方法主要有提问式翻译法、特征过滤法、中间语言翻译法、文本翻译法和同源匹配法等。我国可比语料库的建设,应在充分考虑系统整体性能的前提下,根据用户需求选择适用的构建方法,完善文本翻译及术语抽取技术,并优化文本对齐方式。In order to satisfy the urgent need of users in multi-language information expression and retrieval, the research and development of comparable corpus have gradually become the focus of researchers and developers in information retrieval. From the perspective of cross language information retrieval, this paper studies several comparable corpus construction methods, which include questions translation method, feature filtering method, intermediate language translation method, text translation method and homologous matching method. The construction of comparable corpus in China should take a full consideration of the whole performance of the system, and then choose the appropriate building method based on user requirements, improve text translation and terminology extraction technology, optimize text alignment method. 4 figs. 18 refs.

关 键 词:可比语料库 构建方法 跨语言信息检索 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象