一种基于交叉验证思想的半监督分类方法  被引量:9

A Semi-supervised Classification Algorithm Based on the Idea of Cross Validation

在线阅读下载全文

作  者:赵建华[1,2] 

机构地区:[1]西北工业大学计算机学院,陕西西安710072 [2]商洛学院计算机科学系,陕西商洛726000

出  处:《西南科技大学学报》2014年第1期34-38,48,共6页Journal of Southwest University of Science and Technology

基  金:陕西省教育厅科研计划项目资助(12JK0748)

摘  要:为了提高半监督分类的有效性,提出一种基于交叉验证思想的半监督分类方法(CV-S3VM)。通过对未标记样本进行伪标记,将伪标记后的样本加入到标记样本集中,参与交叉验证,选取能使SVM分类器误差最小的标记作为最终的标记,实现对未标记样本进行标记。依次挖掘未标记样本的隐含信息,增加标记样本的数目。使用UCI数据集模拟半监督分类实验环境,结果表明CV-S3VM具有较高的分类率,在标记样本较少的情况下效果更为明显。In order to improve the performance of semi - supervised classifier, a kind of semi - supervisedclassification algorithm CV - S3VM based on the idea of cross validation was proposed. Unlabeled sampleswere labeled and added to the labeled sample set to participate in cross validation. The labels which makeSVM classifier error minimum were selected as the final lables to mark the unlabeled samples. In this waythe information embedded in the unlabeled samples were mined and the number of labeled samples wasexpanded. Finally, the UCI dataset was used to simulate the semi -supervised classification experimentalenvironment. The results show that CV - S3VM has a higher classification rate. In the case of few labeledsamples, the effect is more obvious.

关 键 词:机器学习 半监督分类 交叉验证 支持向量机 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象