面向事件的多语平行语料库构建研究  被引量:4

Research on Event-Oriented Multiligual Parallel Corpus Construction

在线阅读下载全文

作  者:张姝[1] 赵铁军[1] 杨沐昀[1] 李生[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001

出  处:《计算机应用研究》2005年第11期23-24,30,共3页Application Research of Computers

基  金:国家"863"计划资助项目(2002AA117010-09);国家自然科学基金资助项目(60375019)

摘  要:讨论了面向北京奥运的多语语料库建设中的若干基础问题。提出了面向事件、多领域融合的语料收集原则,制定了具有分类信息的标注规范,初步建立了具有近七万句对的可控多语语料库。Discusses several fundamental problems of muhilingual corpus construction, which oriented Beijing Olympic games, and proposes event-oriented multi-domain fused corpus selection rule, establishes marking guidelines with classification information. A controlled multilingual corpus has been built which contained nearly 70 000 aligned sentence pairs.

关 键 词:语料收集原则 标注规范 可控多语语料库 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象