检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]东北林业大学理学院数学系,哈尔滨150040 [2]北京科技大学信息工程学院,北京100083
出 处:《计算机工程与应用》2007年第4期170-172,共3页Computer Engineering and Applications
基 金:北京市自然科学基金(the Natural Science Foundation of Beijing City of China under Grant No.4022008)。
摘 要:提出了一种新的Web文本聚类算法WTCA——基于自组织特征映射神经网络(SOM)的聚类算法。该算法分为训练SOM网络及聚类分析两个阶段,具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪音能力强。该算法应用到现代远程教育网,可以对各类远程教育站点上收集的文本资料信息自动进行聚类分析;从海量Web文本信息源中快速有效地获取重要的知识。In this paper,we present a new algorithm of Web text clustering mining WTCA.This algorithm includes the training stage and the clustering stage of SOM network.It can distinguish the most meaningful features from the Concept Space without the evaluation function.The algorithm has been applied to the Modern Long-distance Education Net.It can automatically congregate the text information of education field,which is collected from education sites and help people to browse the important information quickly by information navigation mechanism and acquire useful knowledge.
关 键 词:WEB文本挖掘 文本聚类 非结构化数据挖掘结构模型 自组织特征映射
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15