检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]天津大学系统工程研究所
出 处:《计算机应用》2005年第7期1634-1637,共4页journal of Computer Applications
基 金:国家自然科学基金资助项目(60275020)
摘 要:提出一种合并分枝的模糊决策树文本分类方法对相似文本类进行分类,并可抽取出分类精度较高的模糊分类规则。首先研究改进了的χ2统计量,并根据改进的χ2统计量对文本的特征词条进行聚合,有效地降低了文本向量空间的维数。然后使用一种合并分枝的模糊决策树进行分类,大大减少了抽取的规则数量。从而既保证了决策树分类的精度和速度,又可抽取出可理解的模糊分类规则。A new method was presented, which extracted similar text categorization rule by a fuzzy decision tree merging some branches. χ~2 statistic was analyzed and improved. The new method converged features of text in terms of the improved χ~2 statistic, and so largely reduced the dimension of the vector space. And then, the fuzzy decision tree was applied to text categorization. The number of categorization rule was reduced largely by merging some branches. Both the understandable categorization rules extraction and better accuracy of categorization can be acquired.
关 键 词:相似文本分类 规则抽取 χ^2统计量 模糊决策树
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3