检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:毛小丽[1] 何中市[1] 邢欣来[1] 刘莉[1]
出 处:《计算机应用研究》2012年第2期530-532,共3页Application Research of Computers
基 金:中央高校基本科研业务费科研专项资助项目(CDJXS11180020);国家科技重大专项项目(2008ZX07315-001)
摘 要:提出了一种实体关系抽取方案,该方案针对实体关系抽取中特征空间维数过高问题,引入了文本分类中的特征选择算法,如信息增益、期望交叉熵和x2统计,实现了特征空间降维。实验结果表明,各特征选择算法均能在尽量保证抽取性能的同时有效地降低向量空间维数,提高分类效率,其中x2统计取得的效果最好。This paper proposed a new entity relation extraction method using the feature selection algorithms such as information gain,expected cross entropy,x2 statistic which were used in text classification for reducing the feature space dimension.Experiments results show that these feature selection algorithms can keep the extraction performance while ensuring reduce the vector space dimension effectively,and improve the classification efficiency.The x2 statistic reaches the best performance.
关 键 词:关系抽取 特征选择 信息增益 期望交叉熵 x2统计
分 类 号:TP309[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.17.59.50