藏文词性自动标注中歧义问题处理方法研究  被引量:1

Study on method of solving ambiguity in Tibetan part of speech tagging

在线阅读下载全文

作  者:羊毛卓玛[1] 

机构地区:[1]青海师范大学民族师范学院,青海海南813000

出  处:《计算机工程与应用》2013年第24期135-137,148,共4页Computer Engineering and Applications

基  金:国家自然科学基金(No.61063015);教育部"长江学者与创新团队发展计划"藏文信息技术创新团队项目(No.IRT0975)

摘  要:藏文词性自动标注是藏文信息处理后续句法分析、语义分析及篇章分析必不可少的基础工作。词性歧义问题的处理是藏文词性自动标注的关键所在,也是藏文信息处理的难点问题。对藏文词性标注中词性歧义问题进行了分析研究,提出了符合藏文语法规则实用于藏文词性标注的解决词性排岐方法。实验证明:该处理方法在藏文词性自动标注中对词性排岐方面有较好的效果,使藏文词性标注正确率有了一定的提高。Tibetan language Part-Of-Speech(POS) tagging is the subsequent parsing of Tibetan language information processing. POS tagging is an essential foundation work for semantic analysis and text analysis. POS ambiguity problem solving is the key to Tibetan POS tagging, is also one of the difficulties in the Tibetan automatic POS tagging. This paper analyzes and studies POS ambiguity problem in the Tibetan POS tagging, and puts forward a method of solving POS ambiguity problem suitable for Tibetan grammar rules. Experiments prove that this method on speech disambiguation in the Tibetan POS tagging has achieved better results and has definitely increased the accuracy of the Tibetan POS tagging.

关 键 词:藏文信息处理 词缀 词性 自动标注 词性排岐 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象