检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江西理工大学信息工程学院,赣州341000 [2]北京科技大学信息工程学院,北京100083
出 处:《北京科技大学学报》2008年第2期217-220,共4页Journal of University of Science and Technology Beijing
基 金:国家自然科学基金重点资助项目(No69835001);教育部科技重点资助项目(教技司[2000]175);北京市自然科学基金资助项目(No4022008)
摘 要:在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.Under the background of the nonstructural data mining model, a Web text clustering mining algorithm based on the discovery feature sub-space model (DFSSM), W, TCDFSSM algorithm, was proposed, which can distinguish the most meaningful features from the concept space without any evaluation function. The WTCDFSSM algorithm was applied in the modern long-distance education net. The result shows that it can automatically congregate the text information of education field, which is collected from education sites on Internet, help people to browse the important information quickly by information navigation mechanism and acquire useful knowledge.
关 键 词:WEB文本挖掘 文本聚类 聚类评价 非结构化数据挖掘结构模型
分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.23.100.174