检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001
出 处:《电子学报》2009年第5期975-980,共6页Acta Electronica Sinica
基 金:国家自然科学基金(No.60803093;No.60675034);国家863高技术研究发展计划(No.2008AA01Z144)
摘 要:本文针对词汇级复述问题提出了一种新的方法.该方法首先利用翻译引擎将双语平行语料库自动转换为单语平行语料库,以此构建复述语料库并用于候选复述的抽取.在此基础上,本文提出了一种新的统计模型.该模型根据特定的上下文为待复述词选择最为合适的复述.实验结果表明自动构建的复述语料库对于词汇级复述的抽取是有效的.同时,本文提出的模型明显优于两种传统模型,在准确率和召回率上分别提高10%左右.This paper presents a new method for lexical paraphrasing. The method first constructs a paraphrase corpus by automatically translating a bilingual parallel corpus into a monolingual parallel corpus,from which candidate paraphrases for words are extracted.After that,a new statistical model is proposed for lexical paraphrasing, which selects the best paraphrase for a word in a given context sentence. Experimental results show that the automatically constructed paraphrase corpus is effective for lexical paraphrasing. In addition, the presented paraphrasing model significantly outperforms two conventional models, enhancing precision and recall by about 10% ,respectively.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3