基于词对依存分类的藏语树库半自动构建研究  被引量:8

Semi-Automatic Building Tibetan Treebank Based on Word-Pair Dependency Classification

在线阅读下载全文

作  者:华却才让 姜文斌[3] 赵海兴[4] 刘群[5] 

机构地区:[1]青海师范大学 藏文信息研究中心,青海西宁810008 [2]陕西师范大学计算机学院,陕西西安710062 [3]中国科学院计算技术研究所智能信息处理重点实验室,北京100190 [4]青海师范大学藏文信息研究中心,青海西宁810008 [5]中国科学院 计算技术研究所智能信息处理重点实验室,北京100190

出  处:《中文信息学报》2013年第5期166-172,共7页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(61063033,61163018,61363055);教育部“春晖计划”合作科研资助项目(Z2012102)

摘  要:依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。According dependency syntactic theory this paper gave Tibetan typed dependencies and its hierarchy,and then we analyzed some problems in building Tibetan dependency Treebank.We proposed a mode to construct dependency tree semi-automatically,it includes word-pairs dependency classification model and dependency edges annotation model with rich features template based on Tibetan language grammar.And we implemented visualized tool which used to build and proofreading 11thousand sentences Treebank.On the baseline system the experimental results show that,the dependency recognition accuracy obtains an improvement of 3%.

关 键 词:藏语依存句法 词对依存分类 藏语树库 藏语依存标注工具 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象