中文信息处理的词法问题--以句本位语法图解树库构建为背景  被引量:5

Lexical Issues in Chinese Information Processing: in the Background of Sentence-based Diagram Treebank Construction

在线阅读下载全文

作  者:彭炜明[1,2] 宋继华[3] 俞士汶[1,2] 

机构地区:[1]北京大学计算语言学教育部重点实验室 [2]北京大学计算语言学研究所,北京100871 [3]北京师范大学信息科学与技术学院,北京100875

出  处:《中文信息学报》2014年第2期1-7,36,共8页Journal of Chinese Information Processing

基  金:国家社科重大项目(12&ZD227);中国博士后科学基金面上资助项目(2013M530455)

摘  要:该文对比了句本位语法图解树库与中文信息处理现行词法规范在分词单位和词类标注两方面的差异,指出目前自动词法分析与句法分析的若干脱节之处,梳理了图解树库中关于临时造词、惯用语等特殊结构的标注策略和语言学理据,并探讨了"依句辨品"和"指称化"等汉语词类相关理论在中文信息处理中的实现方式。This paper compares the Sentence-based DiagramTreebank with existing lexical specification in the aspect of word segmentation unit and POStagging, revealing the disjunction between automatic lexical analysis and parsing in the current Chinese information processing. It describes the parsing strategy of some special structures such as nonce formation and idiomsin the Diagram Treebank as well as their linguistics rationale. It also explores the imple- mentation of the Chinese word classtheories such as "For All Words ,the Word-class Is Based on the Sentence" and "Referentiality" in Chinese information processing.

关 键 词:中文信息处理 临时造词 句本位语法 图解树库 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象