检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:罗森林[1] 刘盈盈[1] 冯扬[1] 韩磊[1] 陈功[1] 王倩[1]
机构地区:[1]北京理工大学信息与电子学院,北京100081
出 处:《北京理工大学学报》2012年第3期311-315,共5页Transactions of Beijing Institute of Technology
基 金:国家"二四二"计划项目(2005C48);北京理工大学科技创新计划项目(2011CX01015)
摘 要:根据现代汉语语义学,构建了一种层次化的句义结构模型.基于该模型构建了汉语句义结构标注语料库(Beijing forest studio-Chinese tagged corpus,BFS-CTC).利用自行开发的标注和管理工具,对模型中各个句义成分及其组合关系进行快速标注,降低培训工作量和标注成本.BFS-CTC涵盖了6种句式类型,约1万句,提供了符合现有规范的词法和句法标注信息与自定义规范的句义结构标注信息,便于词法、句法和句义的对照分析研究,以及语料的综合使用和横向分析.此外,BFS-CTC还具有较强的可扩展性,可在核心标注库基础上扩展生成其它扩展库和标注资源.Based on the modern Chinese semantics,a Chinese sentential semantic mode is built,and then a Chinese tagged corpus,BFS-CTC(Beijing forest studio-Chinese tagged corpus),is built according to the Chinese sentential semantic mode.There are more than ten thousand sentences in the corpus,and the corpus contains six kinds of Chinese syntactic types.Tagging the sentence quickly and conveniently could be implemented by using the self-developed tools.BFS-CTC provides lexical,syntactic and sentential semantic structure tagging information,so that it could be used in comparative analysis of syntactic and semantic,or used for horizontal analysis.In addition,the corpus has good scalability,and it could generate more targeted extension tagged banks.
关 键 词:中文信息处理 句义分析 句义结构 语义标注 语料库
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147