检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华信息科学与技术国家实验室(筹) [2]清华大学信息技术研究院语音和语言技术中心,北京100084
出 处:《中文信息学报》2014年第5期102-110,共9页Journal of Chinese Information Processing
基 金:国家973计划(2013CB329304);国家自然科学基金(61373075)
摘 要:汉语简洁灵活的意合型篇章组合结构,对传统的基于关联词的篇章连贯性描述体系提出了新的挑战。该文引入话题链描述形式,设计不同类型的话题评述关系集,构建了以话题链为主,融合关联词语和其他连贯形式描述机制,覆盖话题评述、并列、因果、转折四大类关系的汉语语篇连贯性描述体系。在清华句法树库TCT上进行的验证实验,发现话题链和关联词语分别覆盖了约76%和50%的汉语复句,并且两者经常同时使用,初步证明了这个体系在句子连贯性描述方面的可行性和有效性。There are few explicit discourse connectives in Chinese texts, which bring in new challenge for the traditional connective-grounded coherence annotation scheme. The paper proposes a new idea to deal with the problem. We introduce topic chain (TC) as a main coherence representation and design several topic-comment relations to describe the complex event relations among TC-linked sentences. Therefore, a new coherence annotation scheme based on TCs and connectives are built accordingly. The tentative confirmatory experiments on the Tsinghua Chinese Treebank (TCT) data set show that more than 76% and 50% Chinese complex sentences have TCs and connectives respectively. They can co-occur in most Chinese sentences. The phenomena verify the feasibility and availability of this scheme.
关 键 词:话题链 话题评述关系 连贯性描述体系 汉语语篇分析
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222