检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:邱江涛[1,2] 唐常杰[2] 乔少杰[2] 段磊[2] 刘齐宏[2]
机构地区:[1]西南财经大学经济信息工程学院,四川成都610075 [2]四川大学计算机学院,四川成都610065
出 处:《四川大学学报(工程科学版)》2008年第6期110-114,共5页Journal of Sichuan University (Engineering Science Edition)
基 金:国家自然科学基金资助项目(60773169);国家"十一五"科技支撑计划资助项目(2006BAI05A01)
摘 要:针对特征向量分量的权重和文本大小对分类规则产生的影响,提出一种可以提高关联文本分类性能的文本分类规则挖掘方法,提出了加权频繁项集的概念和相应的加权频繁项集挖掘算法,在分类规则中突出特征向量权重大的向量分量;提出一种特征向量预处理方法,消除文本大小对挖掘分类规则的影响。实验表明,解决上述两个问题将可以很好的提高文本分类的性能。The size of text and weight of elements in feature vectors may affect text classification rule.In order to improve the classification accuracy,new concepts of the weighted frequent items and a weighted frequent item-set mining algorithm to highlight great weight items were proposed.A pre-processing method for feature vectors was proposed to eliminate ill effects of the size of text on generating classification rules.Experiments demonstrated utility and feasibility of the method.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229