面向大数据的在线特征提取研究  被引量:4

Big Data Oriented Online Feature Extraction

在线阅读下载全文

作  者:许烁娜[1] 曾碧卿[1] 熊芳敏[1] 

机构地区:[1]华南师范大学软件学院,佛山528225

出  处:《计算机科学》2014年第9期239-242,共4页Computer Science

基  金:国家自然科学基金(71272144);广州市科技计划项目(2013KP084);广东省自然科学基金项目(8151063101000040)资助

摘  要:在大数据环境下,当利用机器学习算法对训练样本进行分类时,训练数据的高维度严重制约了分类算法的性能。文中应用L1准则的稀疏性,提出了一种在线特征提取算法,并用该算法对训练实例进行分类。利用公开数据集对算法的性能进行了分析,结果表明,提出的在线特征提取算法能准确地对训练实例进行分类,因而能更好地适用于大数据环境下的数据挖掘。In big data, the high dimension of training samples makes it difficult for classifying these samples during data mining. Applying the sparsity of the L1 norm, this paper proposed an online feature selection algorithm, and used this algorithm to classify the training samples. Experiments on public datasets show that the proposed online feature selection algorithm has better prediction accuracy than related work, and thus can be applicable to data mining for big data.

关 键 词:大数据 机器学习 在线特征提取 算法 

分 类 号:TP312[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象