基于自动文本分类的关键词抽取算法  被引量:18

Keywords Extraction Algorithm Based on Text Self-motion Categorization

在线阅读下载全文

作  者:张虹[1] 

机构地区:[1]潍坊学院计算机与通信工程学院,潍坊261061

出  处:《计算机工程》2009年第12期145-147,共3页Computer Engineering

摘  要:分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来,准确完成抽取关键词的工作,并具有一定的通用性。This paper analyzes several existing Chinese word segmentation methods, brings out a keywords extraction algorithm which according to the weight formula. The parameters are trained and optimized by the means of genetic algorithm, so a set of parameters which are suit for Chinese text are received and the precision of subtopic segmentation is improved. Experiments show that the extraction system can cut out named entity effectually, complete the task of extraction keywords accurately, and this method is current.

关 键 词:文本分类 分词技术 关键词抽取 遗传算法 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象