基于线性规划的无监督文本分类  

在线阅读下载全文

作  者:袁玉虎[1] 

机构地区:[1]上海理工大学管理学院,上海200093

出  处:《软件导刊》2012年第7期23-25,共3页Software Guide

摘  要:有监督的文本分类方法的研究与应用已经日渐成熟。提出了一种算法,针对大规模数据集进行无监督的文本分类,类似于潜在语义索引(LSI)的思想。首先,构建了用来表述主题分布的混合模型,再通过线性规划的方法计算每个文本的混合系数,然后利用混合系数对文本进行分类。最后,在arXiv文本集中对该算法进行了实验,结果显示分类效果比较理想。

关 键 词:线性规划 混合模型 文本分类 潜在语义索引 混合系数 

分 类 号:TP314[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象