检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京师范大学数学与计算机科学学院,南京210097 [2]苏州大学江苏省计算机信息处理重点实验室,苏州215006
出 处:《计算机工程与应用》2006年第8期170-172,177,共4页Computer Engineering and Applications
基 金:江苏省重点实验室开放基金资助项目(编号:KJS03064)
摘 要:将基于等价关系的模糊聚类技术应用于中文文本分类,提出了基于模糊聚类的中文文本分类算法ATCFC。该算法利用基于二级字索引的正向最大匹配算法对文本分词,建立模糊特征向量空间模型,使用贴近度法刻划文本间的相似度。利用算法ATCFC对文本集合进行动态聚类实验,实验结果表明算法ATCFC对于中文文本分类是可行、有效的。This paper studies Chinese text categorization with the technique of fuzzy clustering based on equivalence relation and proposes an algorithm(ATCFC) for Chinese text categorization based on fuzzy clustering, This algorithm uses forward maximum match algorithm based on two-level word-index to segment Chinese text,creates fuzzy feature vector space model and describes similarity degree among texts using the method of close degree.Algorithm ATCFC is used to conduct a dynamic clustering experiment on a text set and the experimental results demonstrate that algorithm ATCFC is feasible and effective for Chinese text categorization.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222