检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]山东师范大学信息科学与工程学院,山东济南250014 [2]山东工商学院计算机科学与技术学院,山东烟台264005
出 处:《计算机安全》2014年第11期18-23,共6页Network & Computer Security
基 金:山东省自然科学基金(ZR2011FL004;ZR2011FM035);烟台市科技发展计划(2010167);山东省高等学校科技计划(J11LG14);山东省科学技术发展计划(软科学)(2013RKB01127)等项目;山东省高校智能信息处理重点实验室(山东工商学院)的资助
摘 要:文献检索时通常会用到LSI(Latent Semantic Indexing)算法。针对算法中返回值受阈值大小影响的问题,对算法中由奇异值分解SVD(Singular Value Decomposition)得到的左、右奇异值矩阵,用k-means算法对其进行聚类,提出了LSI改进算法。实验结果表明,与传统的LSI方法相比,改进算法在提供k-means算法分类的维度时获得了更好的性能,证明了算法的有效性。In the literature search,we usually used LSI(Latent Semantic Indexing) algorithm. For the problem of the return value of the algorithm is impacted of the size of the threshold, the algorithm by the SVD(Singular Value Decomposition) resulting left and right singular value matrix, can be clustering by k-means algorithm,LSI improved algorithm is proposed. The experimental results show that, compared with the traditional method of LSI, improved algorithm when providing k- means algorithm classification dimension obtained better performance, prove the effectiveness of the algorithm.
关 键 词:LSI算法 奇异值分解 K-MEANS算法 矩阵 双向聚类
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.124.142