基于改进的TF-IGM热词提取算法研究  

Research on improved TF-IGM of hot words extraction algorithm

在线阅读下载全文

作  者:朱杰[1] 

机构地区:[1]河海大学计算机与信息学院,南京211100

出  处:《信息技术》2018年第3期101-103,107,共4页Information Technology

摘  要:关于热词的分析提取,主要根据特征词的权重评估一字词对于一个文件集或一个语料库中的重要程度。在信息技术中,传统的TF-IDF函数得到广泛运用。在文中分类中,有学者提出TF-IGM函数,即量化词项使用词频和文档重力力矩来判断一个特征是否有区分度,文中针对TF-IGM函数进行改进研究。By analyzing and extracting the hot words,i t often relies on the term weighting,which is the importance ol the word in the f i le sets or corpus. I t is widely used about traditional TF-IDF function in the information technology. In the text classification,some researchers proposed the TF-IGM function that means weighting the term by using the term frequence and the inverse gravity moment ol documents. This paper improves the TF-IGM function expectiong some new researches.

关 键 词:主题发现 文本数据 权重计算 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象