基于词类串的汉语句子结构相似度计算方法  被引量:28

A Similarity Measure Method of Chinese Sentence Structures

在线阅读下载全文

作  者:王荣波[1] 池哲儒[1] 

机构地区:[1]香港理工大学电子及资讯工程系多媒体信号处理中心

出  处:《中文信息学报》2005年第1期21-29,共9页Journal of Chinese Information Processing

摘  要:句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的汉英机器翻译研究 ,汉语句子相似度衡量的准确性 ,直接影响到最后翻译结果的输出。本文提出了一种汉语句子结构相似性的计算方法。该方法比较两个句子的词类信息串 ,进行最优匹配 ,得到一个结构相似性的值。在小句子集上的初步实验结果表明 ,该方法可行 ,有效 ,符合人的直观判断。Example-based machine translation(EBMT)is an important branch of machine translation that has been studied extensively for about twenty years.So far,some progresses have been gained because of researchers' hard work.Sentence similarity measure certainly is one of the most important problems addressed in EBMT.For EBMT from Chinese to English,the performance of similarity measure of Chinese sentences affects directly final translation result of an input sentence.In this paper,we proposed a similarity measure method of Chinese sentence structures for example-based Chinese to English machine translation.In this method,the algorithm performs the optimal matching between the word type sequences of two compared sentences.The preliminary experimental results show that the measure method works well when it is tested on a small dataset.

关 键 词:人工智能 机器翻译 基于实例机器翻译 汉英机器翻译 句子相似度衡量 自然语言处理 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象