检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]川北医学院基础医学院,四川南充637100 [2]西华师范大学商学院,四川南充637009
出 处:《计算机应用与软件》2014年第11期109-112,共4页Computer Applications and Software
基 金:四川省教育厅2010年青年基金项目(10ZC102)
摘 要:关键词抽取是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。在分析传统中文关键词抽取方法不足的基础上,提出一种基于多特征的中文关键词提取方法。该方法在抽取中文关键词过程中,从词频、关联度、词性以及位置等多种特征来全面考查关键词,有效地避免了传统关键词提取方法产生的偏差。实验结果表明,与传统方法相比,该方法在不同测试集上关键词提取的平均召回率均得到明显提升。Keywords extraction is the basis for the techniques of information retrieval,text classification,text clustering and automatic summarisation.According to the analysis on shortcomings of traditional Chinese keyword extraction methods,we propose a multi-feature-based Chinese keyword extraction method.The method comprehensively inspects the keywords in the process of Chinese keyword extraction from multiple features such as the word frequency,correlation,part of speech( POS) and position,etc.,and effectively avoids the derivations in traditional keywords extraction methods.Experimental results demonstrate that the average recall rate of the keywords extraction improves significantly on different test sets compared with traditional methods.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13