检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]青海师范大学藏文信息研究中心,西宁810008 [2]陕西师范大学计算机科学学院,西安710062
出 处:《计算机工程》2013年第4期300-304,共5页Computer Engineering
基 金:国家自然科学基金资助项目(61063033;61163018);国家"973"计划前期研究专项基金资助项目(2010CB334708);青海省科技基金资助项目(2011-Z-752)
摘 要:现有藏语句法体系复杂,不利于藏文自然语言处理的应用。为此,提出基于判别式的藏语依存句法分析方法,采用感知机方法训练句法分析模型,CYK自底向上算法解码生成最大生成树。实验结果表明,在人工标注的测试集上,句法分析正确率达到81.2%,可实际应用到藏语依存树库的构建和其他自然语言处理中。The existing Tibetan syntax system is complex, which is not conducive to the application of Tibetan natural language processing. So this paper describes an approach based on discriminant for analysis of Tibetan text dependency structure, where perceptron training method is used to training parsing model. And it aJso proposes a maximum spanning tree with CYK from the bottom-up algorithm for decoding. Experimental results show that, the method obtains acceptable score of 81.2% on manual test set. And it is applicable to Tibetan dependency library and other natural language processing.
关 键 词:藏语依存句法 句法标注规范 最大生成树 特征模板 依存句法 感知机
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7