检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:谢坤武[1]
机构地区:[1]湖北民族学院信息工程学院,湖北恩施445000
出 处:《湖北民族学院学报(自然科学版)》2009年第4期415-419,共5页Journal of Hubei Minzu University(Natural Science Edition)
基 金:湖北省科技攻关项目(2004AA210B01)
摘 要:随着互联网中信息的日益增长,通过文本挖掘,快速、准确地检索信息和分类信息成为人们日益迫切的要求,具有广泛的应用前景和实用价值.依据信息论的思想,从文档信息量变化的角度,对文本数据从概率角度来研究文本数据的聚类分析,研究信息量在层次聚类过程中所呈现的规律性,进而提出一种基于信息量模型的聚类分析算法.With the growing information on the Internet,rapid and accurate retrieval and classification of information through text mining has become increasingly important,and it has a wide application prospect and practical value.This paper,based on information theory,studies the clustering of text data according to change of information amount of the document and the rule of information amount in the process of hierarchical clustering,and presents a clustering algorithm based on the information amount model.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7