基于平行语料库的英汉跨语言信息检索设计研究  被引量:5

Research on the design of English Chinese cross language information retrieval based on parallel corpus

在线阅读下载全文

作  者:叶雪[1] 梁娟 YE Xue;LIANG Juan(Shaanxi Technical College of Finance and Economics,Xianyang 712099,China)

机构地区:[1]陕西财经职业技术学院,陕西咸阳712099

出  处:《电子设计工程》2021年第17期135-138,共4页Electronic Design Engineering

基  金:陕西省教学科学规划项目(SGH17H501);陕西财经职业技术学院校级基金项目(2014sczy14)。

摘  要:针对英语跨语言信息检索中数据量大、数据检索困难等问题,提出了基于平行语料库的英汉跨语言信息检索系统的设计。对系统的结构进行分析,主要包括标题查询、短查询与长查询,并对其进行翻译处理。实现英汉跨语言信息检索系统的详细设计。设计了系统翻译算法,实现英汉跨语言的预处理、分析和翻译。并且设计索引模块,将索引文件写入到磁盘中对信息进行全文索引。测试结果表明,文中所设计的系统能够满足实际需求。Aiming at the problems of large amount of data and difficulties in data retrieval,this paper proposes the design of English Chinese cross language information retrieval system based on parallel corpus.The structure of the system is analyzed,including title query,short query and long query,and their translation processing.The detailed design of English Chinese cross language information retrieval system is realized.A systematic translation algorithm is designed to realize cross language preprocessing,analysis and translation.And the index module is designed to write the index file to the disk for full⁃text indexing.The test results show that the system designed in this paper can meet the actual needs.

关 键 词:平行语料库 跨语言 信息检索 翻译测试 

分 类 号:TN98[电子电信—信息与通信工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象