基于语序变换的藏文复述句生成方法  被引量:2

Tibetan Paraphrase Sentence Generation Method Based on Word Order Transformation

在线阅读下载全文

作  者:柔特[1,2] 才让加[1,2] 孙茂松[3] ROU Te;CAI Rangjia;SUN Maosong(Computer College,Qinghai Normal University,Xining 810008,China;Key Laboratory of Tibetan Information Processing of Ministry of Education,Qinghai Normal University,Xining 810008,China;State Key Laboratory of Intelligent Technology and System,Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China)

机构地区:[1]青海师范大学计算机学院,西宁810008 [2]青海师范大学藏文信息处理教育部重点实验室,西宁810008 [3]清华大学计算机科学与技术系智能技术与系统国家重点实验室,北京100084

出  处:《计算机工程》2018年第4期231-235,共5页Computer Engineering

基  金:国家自然科学基金(61662061);国家社会科学基金(14BYY132;16YY167);教育部长江学者和创新团队发展计划项目(IRT1068);青海省重点实验室项目(2015-Z-Y03;2017-GX-146)

摘  要:机器理解藏文语句存在灵活性差和复杂性高的问题。为此,针对藏文相同语义句子的不同表达方式,设计复述句自动生成方法。通过对藏文句型结构、句子内部组块进行分析,利用全排列递归算法生成复述句。实验结果显示,与其他语言复述生成方法不同,该方法根据藏文句子中组块数量的不同,通过一个句子可以生成一个或多个,甚至上千个句义相同的复述句并且准确率达到93.4%,可应用于藏汉机器翻译、机器翻译评测和藏文问答系统等领域。Aiming at the problem of the flexibility and complexity of machines to understand natural language and Tibetan sentences,in view of the different expressions of the same semantic sentences in Tibetan language,this paper proposes a Tibetan paraphrases sentence generation method.Through the parsing of the sentence structure of Tibetan and the internal chunks of sentences,it uses permutation recursive algorithm to generate paraphrases sentence.Experimental results show that different from other languages and Tibetan chunks,the number of chunks in a sentence can generate one or more or even thousands of complex sentences with the same semantic meanings by the proposed method,and the accuracy of automatic generation of Tibetan paraphrases sentences reaches 93.4%.It can be applied to Tibetan-Chinese machine translation,machine translation evaluation,Tibetan QA system and other research fields.

关 键 词:复述生成 藏文 语序变换 句型结构 组块分析 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象