检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]武汉大学信息资源研究中心 [2]武汉大学信息管理学院图书馆学系 [3]武汉大学信息管理学院
出 处:《国家图书馆学刊》2016年第6期64-70,共7页Journal of The National Library of China
基 金:教育部人文社会科学重点研究基地重大项目"基于内容的多语言信息组织与检索研究"(项目编号:14JJD870001)研究成果之一
摘 要:为满足用户对多语言信息表达与获取的迫切需求,可比语料库的研究和开发逐渐成为信息检索领域研究者和系统开发人员的关注重点。从跨语言信息检索视角出发,可比语料库的构建方法主要有提问式翻译法、特征过滤法、中间语言翻译法、文本翻译法和同源匹配法等。我国可比语料库的建设,应在充分考虑系统整体性能的前提下,根据用户需求选择适用的构建方法,完善文本翻译及术语抽取技术,并优化文本对齐方式。In order to satisfy the urgent need of users in multi-language information expression and retrieval, the research and development of comparable corpus have gradually become the focus of researchers and developers in information retrieval. From the perspective of cross language information retrieval, this paper studies several comparable corpus construction methods, which include questions translation method, feature filtering method, intermediate language translation method, text translation method and homologous matching method. The construction of comparable corpus in China should take a full consideration of the whole performance of the system, and then choose the appropriate building method based on user requirements, improve text translation and terminology extraction technology, optimize text alignment method. 4 figs. 18 refs.
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145