基于词性信息自动识别和标注非分句  

Automatic identification and labeling of non-clauses based on part of speech

在线阅读下载全文

作  者:李琼[1] 李志[1] 

机构地区:[1]华中师范大学国际文化交流学院,武汉430079

出  处:《长春工程学院学报(社会科学版)》2011年第1期77-80,共4页Journal of Changchun Institute of Technology(Social Sciences Edition)

基  金:教育部人文社会科学研究青年项目的研究成果(项目编号:09YJC740032);华中师范大学"丹桂计划"项目

摘  要:在完成自动分词和词性标注工作的基础上,进行分句层次和关系的自动划分和标注,以期建设一个面向中文信息处理的大规模复句"精加工"语料库。可以利用词性信息制定一系列规则去实现部分非分句的自动识别和标注,同时建设一个短语库,把短语语言片段收录其中。In order to build a "finishing" compound-sentence corpus for Chinese Information Process,automatic word segmentation and POS tagging work should be completed first of all.On this basis,automatic classification and labeling of levels and relationship between clauses should be conducted.We can use the POS information to develop a set of rules to achieve some non-clause of automatic identification and labeling,but also can build a phrase library,which includes the phrase language fragments.

关 键 词:词性 短语库 词性标注 

分 类 号:H08[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象