汉语显式篇章关系分析  被引量:1

Explicit Discourse Relation Parsing of Chinese Text

在线阅读下载全文

作  者:丁彬[1] 孔芳[1] 李生[1] 周国栋[1] 

机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006

出  处:《中文信息学报》2014年第6期101-106,共6页Journal of Chinese Information Processing

基  金:国家自然基金(61333018);国家自然基金(61273320);国家863(2012AA011102)

摘  要:篇章关系分为显式和隐式两种。显式关系的显著特征是篇章的基本单元之间存在显式连接词。针对汉语显式篇章关系,构建了包括汉语连接词识别和篇章关系分类的显式篇章关系分析平台。该文选取汉语宾州树库(Chinese Penn Treebank,CTB)中的500篇文本进行了汉语显式篇章关系标注;结合连接词的中心词,采用最大熵分类器构建了汉语连接词识别模块,其性能F1值达到了66.79%;基于连接词及其词性等上下文特征,构建了篇章关系分类器,其在最顶层4大类语义关系上的分类性能的F1值为91.92%。Discourse relations can be expressed explicitly or implicitly. This paper focuses on explicit discourse rela- tions that are explicitly signaled by discourse connectives. We propose an explicit discourse relation parsing plat- form, containing connective identification and sense classification. Using 500 texts from the Chinese Discourse Tree- Bank corpus (CTB), we annotate an explicit discourse relations corpus. Considering headwords of connectives, we construct a connective identifier using maximum entropy based on this corpus, which reports F1 of 66.79%. And a sense classifier based on the context of connective itself is proposed and reports F1 of 91.92%.

关 键 词:连接词识别 语义关系分类 最大熵分类器 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象