基于加权频繁项集的文本分类规则挖掘被引量：3

Mining Text Classification Rules Based on Weighted Frequent Itemsets

作　　者：邱江涛[1,2] 唐常杰[2] 乔少杰[2] 段磊[2] 刘齐宏[2]

机构地区：[1]西南财经大学经济信息工程学院,四川成都610075 [2]四川大学计算机学院,四川成都610065

出　　处：《四川大学学报（工程科学版）》2008年第6期110-114,共5页Journal of Sichuan University (Engineering Science Edition)

基　　金：国家自然科学基金资助项目(60773169);国家"十一五"科技支撑计划资助项目(2006BAI05A01)

摘　　要：针对特征向量分量的权重和文本大小对分类规则产生的影响,提出一种可以提高关联文本分类性能的文本分类规则挖掘方法,提出了加权频繁项集的概念和相应的加权频繁项集挖掘算法,在分类规则中突出特征向量权重大的向量分量;提出一种特征向量预处理方法,消除文本大小对挖掘分类规则的影响。实验表明,解决上述两个问题将可以很好的提高文本分类的性能。The size of text and weight of elements in feature vectors may affect text classification rule.In order to improve the classification accuracy,new concepts of the weighted frequent items and a weighted frequent item-set mining algorithm to highlight great weight items were proposed.A pre-processing method for feature vectors was proposed to eliminate ill effects of the size of text on generating classification rules.Experiments demonstrated utility and feasibility of the method.

关键词：关联规则文本分类加权频繁项集

分类号：TP311.13[自动化与计算机技术—计算机软件与理论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于加权频繁项集的文本分类规则挖掘被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于加权频繁项集的文本分类规则挖掘 被引量：3

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于加权频繁项集的文本分类规则挖掘被引量：3