基于话题链的汉语语篇连贯性描述体系  被引量:10

Topic-Chain-Based Coherence Annotation Scheme for Chinese Text

在线阅读下载全文

作  者:周强[1,2] 周骁聪 

机构地区:[1]清华信息科学与技术国家实验室(筹) [2]清华大学信息技术研究院语音和语言技术中心,北京100084

出  处:《中文信息学报》2014年第5期102-110,共9页Journal of Chinese Information Processing

基  金:国家973计划(2013CB329304);国家自然科学基金(61373075)

摘  要:汉语简洁灵活的意合型篇章组合结构,对传统的基于关联词的篇章连贯性描述体系提出了新的挑战。该文引入话题链描述形式,设计不同类型的话题评述关系集,构建了以话题链为主,融合关联词语和其他连贯形式描述机制,覆盖话题评述、并列、因果、转折四大类关系的汉语语篇连贯性描述体系。在清华句法树库TCT上进行的验证实验,发现话题链和关联词语分别覆盖了约76%和50%的汉语复句,并且两者经常同时使用,初步证明了这个体系在句子连贯性描述方面的可行性和有效性。There are few explicit discourse connectives in Chinese texts, which bring in new challenge for the traditional connective-grounded coherence annotation scheme. The paper proposes a new idea to deal with the problem. We introduce topic chain (TC) as a main coherence representation and design several topic-comment relations to describe the complex event relations among TC-linked sentences. Therefore, a new coherence annotation scheme based on TCs and connectives are built accordingly. The tentative confirmatory experiments on the Tsinghua Chinese Treebank (TCT) data set show that more than 76% and 50% Chinese complex sentences have TCs and connectives respectively. They can co-occur in most Chinese sentences. The phenomena verify the feasibility and availability of this scheme.

关 键 词:话题链 话题评述关系 连贯性描述体系 汉语语篇分析 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象