检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王步康[1,2] 王红玲[1,2] 袁晓虹[1,2] 周国栋[1,2]
机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006 [2]江苏省计算机信息处理技术重点实验室,江苏苏州215006
出 处:《中文信息学报》2010年第1期25-29,47,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(60673041;60873150);国家教育部博士点基金资助项目(200802850006);江苏省自然科学基金资助项目(BK2008160);江苏省高校自然科学重大基础研究项目(08KJA520002)
摘 要:依存句法是句法分析的一种,相比于短语结构句法分析,依存句法具有更简洁的表达方式。该文采用英文语义角色标注的研究方法,实现了一个基于中文依存句法分析的语义角色标注系统。该系统针对中文依存关系树,采用有效的剪枝算法和特征,使用最大熵分类器进行语义角色的识别和分类。系统使用了两种不同的语料,一种是由标准短语结构句法分析(CTB5.0)转换而来,另一种是CoNLL2009公布的中文语料。系统分别在两种语料的标准谓词和自动谓词的基础上进行实验,在标准谓词上取得的F1值分别为84.30%和81.68%,在自动谓词上的F1值为81.02%和81.33%。Dependency representations are more simple and intuitive than constituent representations for Chinese parse. This paper implements a Chinese dependency parse based semantic role labeling (SRL) by using the similar methods in English SRL. In the system, effective pruning algorithm and useful features are adopted for Chinese de- pendency tree, and the semantic role identification and classification are accomplished by a maximum entropy classifi- er. Two different corpora are adopted to test our system, one is transferred from constituent-based corpus (CTBS. 0), and the other is Chinese dataset provided by CoNLL 2009 shared task. Based on the two datasets, the system achieves, respectively, 84.3% and 81.68% in labeled F1 for gold predicates, and 81.02% and 81. 33% for automatic predicates.
关 键 词:计算机应用 中文信息处理 语义角色标注 依存关系 最大熵分类器
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.157