粒计算应用于非平衡化学模式分类  

Granular computing applied to imbalanced chemical patterns classification

在线阅读下载全文

作  者:罗建宏[1] 陈德钊[1] 

机构地区:[1]浙江大学化学工程与生物工程学系,浙江杭州310027

出  处:《计算机与应用化学》2010年第4期425-429,共5页Computers and Applied Chemistry

基  金:国家自然科学基金资助项目(20276063)

摘  要:化学样本数据常为非平衡,用传统方法分析这些数据集时,对于需特别关注的少数类数据,识别能力往往较差。因此,提出建立基于粒计算的分类规则模型(GCCRM),先用改进的自适应共振网络ETM-ART2将性质相近的个体聚合为信息粒,降低样本容量和问题规模,同时又保持较高的纯度;然后将信息粒的属性特征模糊离散化,简化它;最后经关联规则挖掘,得可预测样本的分类规则模型。用于识别玻璃,结果GCCRM能剔除冗余信息,加强关键特征,所提取的分类规则预测正确率高,尤适用于非平衡数据集,其性能比C4.5决策树、支持向量机SVM等算法优良。Chemical data is often imbalanced,when analyzes these data,traditional machine learning algorithms usually has poor recognition capability on the concerned minority class.Therefore,a granular computing based classification rules mining model(GCCRM) is proposed.ETM-ART2 is utilized to construct information granulations(IGs),then each IGs' attribute is fuzzy transformed to three linguistic terms,which can simplify research objects.Association rules mined from these IGs are applied to decision for unknown patterns. Then GCCRM is utilized to glasses recognition problem,and the experimental results comparing with C4.5 and SVM demonstrate the superiority of this method,especially for imbalanced data.

关 键 词:信息粒 模糊转换 分类 非平衡数据集 

分 类 号:O6-39[理学—化学] TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象