检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《数字图书馆论坛》2009年第11期67-71,共5页Digital Library Forum
基 金:本文系国家科技支撑计划项目“多语言信息服务环境关键技术研究与应用”(2006BAH03802)和“科技文献信息服务系统应用示范”(2006BAH03806)的研究成果之一.
摘 要:双语语料库在机器翻译、跨语言信息检索以及翻译词典编纂等自然语言处理领域有着越来越重要的用途。该研究利用同族专利文献信息作为双语语料的来源,探讨了基于同族专利获取双语语料的可行性,以获取汉英双语语料为实例提出了双语语料的获取流程,同时进行双语对译部分的对齐规则的研究,从而构建出科技领域的平行双语语料库。最后,还阐述了该方法的相关注意事项以及应用前景。Bilingual corpus have become increasingly important valuable resource for machine translation, cross-language information retrieval, translation dictionary and other applications. This paper describes a new method for bilingual corpus extraction based on patent family and takes example for English-Chinese bilingual corpus. First, it discusses the feasibility of this approach and an available process to extract high quality bilingual corpus from two selected patent database is designed. Then, the English-Chinese equivalent units are obtained through alignment role from bilingual corpus which extracted in order to build the Chinese-English bilingual parallel corpus for a specific science and technology area. Finally, it describes the notes and application prospects of the method.
分 类 号:G306[文化科学] TP391.2[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28