基于TFIDF算法的关键词提取方法  被引量:5

A Keyword Extracting Technique Based on TFIDF Algorithm

在线阅读下载全文

作  者:章志华[1] 陆海良 郁钢 

机构地区:[1]浙江中烟工业有限责任公司,浙江杭州310009

出  处:《信息技术与信息化》2015年第8期158-160,共3页Information Technology and Informatization

摘  要:企业知识库数据量以爆炸性的速度增长,其中大部分信息是非结构化的文本数据,系统往往不能快速准确地满足企业用户的查询请求。为解决这一问题,提出了一种基于TFIDF算法同义替换和相邻合并的文本挖掘技术。这种技术可以降低服务器压力,使服务人员可以更快更准确的从知识库中寻找出相关信息。最后以实例验证了本算法的有效性。Enterprise knowledge repository increases with the explosive growth rate, most of which is unstructured text data.The application often can not meet the user's query requests quickly and accurately. To solve this problem, a novel text mining technique based on TFIDF with synonymous substitutions and adjacent integrationis proposed, which can reduce the server stress and make it more efficient to extract expected information. Finally, examples demonstrate the effectiveness of the algorithm.

关 键 词:文本挖掘 关键词提取 词频 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象