检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:廖一星[1]
机构地区:[1]浙江财经学院信息学院计算机应用研究所,杭州310018
出 处:《计算机工程与应用》2009年第33期117-119,共3页Computer Engineering and Applications
摘 要:Sprinkling方法是一种集成了训练样本类别信息的监督潜在语义模型。但是该方法特征权重采用词频,降低了文本分类效果,同时该模型并没有考虑不同样本对分类的贡献能力,而是认为样本对分类的贡献相同,另外,该模型采用多个特征映射一个类别来加强类别知识对分类的贡献。为此,文章在Sprinkling方法的基础上提出了一种新的监督潜在语义模型。实验结果表明,该文方法的总体性能优于原始的Sprinkling方法,在特征数为1100时,获得了最高分类精度,提高幅度达到1.71%。Sprinkling method is a supervised latent semantic indexing integrated with the classification information of the training sample.But the method of feature weight is TF which decreases the text classification performance.And this method doesn't consider the contribution ability of different samples.In contrast,this method considers the contribution ability of every sample is same.In addition,this method uses several features corresponding to a class label to boost the contribution of class knowledge to classification.A new supervised latent semantic indexing is proposed based on the sprinkling method.The results show that the new model outperforms the sprinkling method.The new model achieves the highest classification performance when feature number is 1,100 which is increased 1.71% compared with the original sprinkling method.
关 键 词:文本分类 潜在语义 sprinkling方法
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.42