基于加权频繁项集的文本分类规则挖掘  被引量:3

Mining Text Classification Rules Based on Weighted Frequent Itemsets

在线阅读下载全文

作  者:邱江涛[1,2] 唐常杰[2] 乔少杰[2] 段磊[2] 刘齐宏[2] 

机构地区:[1]西南财经大学经济信息工程学院,四川成都610075 [2]四川大学计算机学院,四川成都610065

出  处:《四川大学学报(工程科学版)》2008年第6期110-114,共5页Journal of Sichuan University (Engineering Science Edition)

基  金:国家自然科学基金资助项目(60773169);国家"十一五"科技支撑计划资助项目(2006BAI05A01)

摘  要:针对特征向量分量的权重和文本大小对分类规则产生的影响,提出一种可以提高关联文本分类性能的文本分类规则挖掘方法,提出了加权频繁项集的概念和相应的加权频繁项集挖掘算法,在分类规则中突出特征向量权重大的向量分量;提出一种特征向量预处理方法,消除文本大小对挖掘分类规则的影响。实验表明,解决上述两个问题将可以很好的提高文本分类的性能。The size of text and weight of elements in feature vectors may affect text classification rule.In order to improve the classification accuracy,new concepts of the weighted frequent items and a weighted frequent item-set mining algorithm to highlight great weight items were proposed.A pre-processing method for feature vectors was proposed to eliminate ill effects of the size of text on generating classification rules.Experiments demonstrated utility and feasibility of the method.

关 键 词:关联规则 文本分类 加权频繁项集 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象