检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈鹏[1] 郭剑毅[1,2] 余正涛[1,2] 线岩团[1,2] 严馨[1,2] 魏斯超
机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650051 [2]昆明理工大学智能信息处理重点实验室,云南昆明650051
出 处:《中文信息学报》2013年第5期144-148,155,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(61175068)
摘 要:针对在采用支持核函数的机器学习算法进行基于特征的中文领域实体关系抽取中,不同核函数对不同中文领域关系抽取在效果上存在差异性的问题,该文提出一种基于凸组合核函数的中文领域实体关系抽取方法。首先,选取实体上下文的词、词性等信息,短语句法树信息及依存信息作为特征,然后通过以径向基核函数,Sigmoid核函数及多项式核函数组成的不同组合比例的凸组合核函数将特征矩阵映射成为不同的高维矩阵,利用支持向量机训练这些高维矩阵构建不同分类模型后测试抽取性能,以确定最优组合比例的凸组合核函数。在收集600篇旅游领域语料上进行关系抽取,实验结果表明最优凸组合核函数能增加实体关系抽取效果,F值达到62.9。For the problem that based on the feature method,different kernel functions caused different performances in Chinese field entity relation extraction by the machine learning method,which supports kernel function,this paper proposed a convex combination kernel function method to deal with this problem.First,this paper chose lexical information,phrase syntactic information and dependent syntactic information as features.Next step was to get different high-dimensional matrixes though mapping by different convex combination kernel functions.Finally,we could get the optimal kernel by testing all classified model that trained all high-dimensional matrixes by SVM.This paper conducted the relation extraction experiment on collecting 600corpuses in tourist field,the experimental result shows that the optimal convex combination kernel function this paper presents can effectively improve the extraction performance,and it gets the best F value which reaches 62.9.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3