检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘俊[1] 邹东升[1] 邢欣来[1] 李英豪[1]
出 处:《计算机应用研究》2012年第11期4224-4227,共4页Application Research of Computers
基 金:中国博士后科学基金资助项目(20110490807);中央高校基金科研业务资助项目(CDJXS10181131)
摘 要:为了使抽取出的关键词更能反映文档主题,提出了一种新的词的主题特征(topic feature,TF)计算方法,该方法利用主题模型中词和主题的分布情况计算词的主题特征。并将该特征与关键词抽取中的常用特征结合,用装袋决策树方法构造一个关键词抽取模型。实验结果表明提出的主题特征可以提升关键词抽取的效果,同时验证了装袋决策树在关键词抽取中的适用性。Keyphrase extraction is a process for extracting a set of terms from a document.This paper proposed a novel topic feature for extracting keyphrase.This topic feature was computed based on topic model which modeled the topic-word distributions and the topic distributions of document.Moreover,it proposed a keyphrase extraction approach based on bagged decision trees.This approach jointed common features and the proposed topic feature.Experimental results demonstrate that the proposed topic feature can make an improvement for keyphrase extraction.At the mean time,an effective performance can be achieved by the bagged decision trees based approach.
分 类 号:TP309[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15