基于模糊决策树的文本分类规则抽取  被引量:13

Text categorization rule extraction based on fuzzy decision tree

在线阅读下载全文

作  者:王煜[1] 王正欧[1] 

机构地区:[1]天津大学系统工程研究所

出  处:《计算机应用》2005年第7期1634-1637,共4页journal of Computer Applications

基  金:国家自然科学基金资助项目(60275020)

摘  要:提出一种合并分枝的模糊决策树文本分类方法对相似文本类进行分类,并可抽取出分类精度较高的模糊分类规则。首先研究改进了的χ2统计量,并根据改进的χ2统计量对文本的特征词条进行聚合,有效地降低了文本向量空间的维数。然后使用一种合并分枝的模糊决策树进行分类,大大减少了抽取的规则数量。从而既保证了决策树分类的精度和速度,又可抽取出可理解的模糊分类规则。A new method was presented, which extracted similar text categorization rule by a fuzzy decision tree merging some branches. χ~2 statistic was analyzed and improved. The new method converged features of text in terms of the improved χ~2 statistic, and so largely reduced the dimension of the vector space. And then, the fuzzy decision tree was applied to text categorization. The number of categorization rule was reduced largely by merging some branches. Both the understandable categorization rules extraction and better accuracy of categorization can be acquired.

关 键 词:相似文本分类 规则抽取 χ^2统计量 模糊决策树 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象