汉语并列复句的自动识别方法被引量：7

Automatic Identification of Chinese Coordination Discourse Relation

机构地区：[1]北京大学信息科学技术学院,北京100871 [2]网络文化与数字传播北京市重点实验室,北京100192

出　　处：《北京大学学报（自然科学版）》2013年第1期1-6,共6页Acta Scientiarum Naturalium Universitatis Pekinensis

基　　金：863计划(2012AA011101);九十八年度蒋经国国际学术交流基金会项目(RG013-D-09);网络文化与数字传播北京市重点实验室开放课题(ICDD201202)资助

摘　　要：针对汉语句际关系中分布最广泛的并列复句,提出一种自动识别的方法。通过对句子语义相似度和结构相似度的计算,使用基于词义的句子相似度计算、最大公共子串、最大谓词周边匹配长度、加重特定词语复现等方法,在广义并列关系上进行评测。最后将其中3种方法进行集成,并取得了较为理想的效果。Several methods are proposed to automatically identify coordination relation, which is the most widely distributed one among discourse relations. The authors exploit semantic similarity and structure similarity to compute the sentence similarity, using lexical similarity, maximum common substring calculation, maximum length matching around head word, special words strengthening. Three of the above methods are integrated, and the experiment achieves promising results.

关键词：并列复句句际关系句子相似度集成方法

分类号：TP391.1[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

汉语并列复句的自动识别方法被引量：7

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

汉语并列复句的自动识别方法 被引量：7

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

汉语并列复句的自动识别方法被引量：7