检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:袁玉虎[1]
出 处:《软件导刊》2012年第7期23-25,共3页Software Guide
摘 要:有监督的文本分类方法的研究与应用已经日渐成熟。提出了一种算法,针对大规模数据集进行无监督的文本分类,类似于潜在语义索引(LSI)的思想。首先,构建了用来表述主题分布的混合模型,再通过线性规划的方法计算每个文本的混合系数,然后利用混合系数对文本进行分类。最后,在arXiv文本集中对该算法进行了实验,结果显示分类效果比较理想。
关 键 词:线性规划 混合模型 文本分类 潜在语义索引 混合系数
分 类 号:TP314[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229