检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:许旭阳[1] 李弼程[1] 张先飞[1] 韩永峰[1]
机构地区:[1]解放军信息工程大学信息工程学院,郑州450002
出 处:《计算机科学》2011年第8期232-235,共4页Computer Science
基 金:国家社科重大基金项目(09&ZD014);国家863项目(2007AA01Z439)资助
摘 要:目前,事件抽取的流行方法是以事件元素或触发词进行驱动,但该方法容易导致正反例不平衡,且在语料库规模较小时存在一定的数据稀疏问题。提出了一种基于事件实例驱动的事件抽取方法。首先,从文档句子中抽取出刻画一个事件发生有代表性的特征,构成候选事件实例表示;其次,通过二元分类器对新闻文本中的事件实例与非事件实例进行分类;最后,对事件实例采用基于层次聚类的k-medoids算法完成事件抽取。该方法不仅克服了正反例失衡以及数据稀疏问题,而且解决了预先定义事件类别的局限性。实验结果验证了该方法的有效性,对比传统方法,事件抽取的准确率与召回率均获得了显著的提高。At present,popular methods of event extraction regard event arguments or triggers as drivers,but they may cause positive and negative samples imbalance.Furthermore,there will be data sparseness problem when the corpus is small.This paper proposed an event extraction method driven by event sample.Firstly,features of event samples were extracted from news text sentences to compose the description of candidate event.Secondly,event samples and non-event samples of news text were classified through binary classification.Finally,event samples were clustered by hierarchical and k-medoids clustering algorithm to complete event extraction.The method not only overcomes positive and negative samples imbalance and data sparseness problem,but also resolves the limit of pre-defined event types.Experimental results indicate that the proposed method is effective,improves precision and recall of event extraction compared to traditional methods.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249