基于“词——词性”匹配模式获取的古汉语树库快速构建方法  被引量:1

An Efficient Approach to Ancient Chinese Treebank Construction Based on “Word or POS” Match

在线阅读下载全文

作  者:何静[1] 宋天宝 彭炜明[1] 朱淑琴 宋继华[1] 

机构地区:[1]北京师范大学信息科学与技术学院,北京100875 [2]北京联合大学师范学院,北京100101

出  处:《中文信息学报》2017年第4期114-121,共8页Journal of Chinese Information Processing

基  金:北京师范大学青年教师基金(2014NT39)

摘  要:该文针对古汉语文本小、句简短、模式性强的结构特点,提出了一种基于"词-词性"匹配模式获取的快速树库构建方法,将句法标注过程规约为获取候选匹配模式、制定句法转换规则、自动生成句法树和最终人工校对四个步骤。该方法可大大缩减人工标注工作量,节省树库构建的工程成本,且所获取的匹配规则在古汉语教学研究中具有一定的实用价值。An efficient approach for ancient Chinese treebank construction is proposed,which is based on "word or POS" match strategy.To deal with the ancient Chinese characterized by short-clauses and typical-patterns,it divides the Chinese treebank construction into four steps:1)candidate match pattern generation;2)syntactic transformation rule composition;3)syntactic parsing;4)manual verification.In addition to minimize the manual annotation cost in treebank construction,the match patterns obtained during this process can provide data support for the ancient Chinese teaching and research.

关 键 词:古代汉语 树库构建 模式获取 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象