基于LDA和TF-IDF的关键词提取算法研究被引量：6

Research on Keyword Extraction Algorithm Based on LDA and TF-IDF

作　　者：苏婧琼苏艳琼 SU Jingqiong;SU Yanqiong(Jinzhong Information College,Shanxi Jinzhong 030800;Shanxi University,Shanxi Taiyuan 030000)

机构地区：[1]晋中信息学院,山西晋中030800 [2]山西大学,山西太原030000

出　　处：《长江信息通信》2024年第1期78-80,共3页Changjiang Information & Communications

基　　金：2022年山西省高等学校科技创新计划各类项目“基于LDA模型的文本表示及关键词提取研究”(课题编号:2022L665)。

摘　　要：在自然语言处理领域,对于海量的文本文件,让用户在最短的时间找到到自己感兴趣的文档,最关键的工作是要每篇文档的关键词提取出来。而不管是针对一篇长文章或是一篇短文章,通常能够直接通过这几个关键字去窥探出整篇文章背后的主题思想。文章分别介绍了LDA主题模型和TFIDF算法在关键词提取中的应用,并进行了对比,结果表明在关键词提取方面都可以取得较好的效果。In the field of natural language processing,for massive text files,the most crucial task for users to find the documents they are interested in in the shortest possible time is to extract the keywords from each document.Whether targeting a long article or a short article,it is usually possible to directly explore the theme behind the entire article through these keywords.This article introduces the application of LDA topic model and TFIDF algorithm in keyword extraction,and compares them.The results show that good results can be achieved in keyword extraction.

关键词：LDA主题模型 TFIDF算法关键词提取

分类号：TP391.1[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于LDA和TF-IDF的关键词提取算法研究被引量：6

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于LDA和TF-IDF的关键词提取算法研究 被引量：6

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于LDA和TF-IDF的关键词提取算法研究被引量：6