一种新的监督潜在语义模型  被引量:1

New model of supervised latent semantic indexing

在线阅读下载全文

作  者:廖一星[1] 

机构地区:[1]浙江财经学院信息学院计算机应用研究所,杭州310018

出  处:《计算机工程与应用》2009年第33期117-119,共3页Computer Engineering and Applications

摘  要:Sprinkling方法是一种集成了训练样本类别信息的监督潜在语义模型。但是该方法特征权重采用词频,降低了文本分类效果,同时该模型并没有考虑不同样本对分类的贡献能力,而是认为样本对分类的贡献相同,另外,该模型采用多个特征映射一个类别来加强类别知识对分类的贡献。为此,文章在Sprinkling方法的基础上提出了一种新的监督潜在语义模型。实验结果表明,该文方法的总体性能优于原始的Sprinkling方法,在特征数为1100时,获得了最高分类精度,提高幅度达到1.71%。Sprinkling method is a supervised latent semantic indexing integrated with the classification information of the training sample.But the method of feature weight is TF which decreases the text classification performance.And this method doesn't consider the contribution ability of different samples.In contrast,this method considers the contribution ability of every sample is same.In addition,this method uses several features corresponding to a class label to boost the contribution of class knowledge to classification.A new supervised latent semantic indexing is proposed based on the sprinkling method.The results show that the new model outperforms the sprinkling method.The new model achieves the highest classification performance when feature number is 1,100 which is increased 1.71% compared with the original sprinkling method.

关 键 词:文本分类 潜在语义 sprinkling方法 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象