噪声消除与SMO算法收敛性  

Eliminating Noisy and SMO Algorithm Convergence

在线阅读下载全文

作  者:何建兵[1] 何清[2] 史忠植[2] 

机构地区:[1]中国科学院研究生院软件学院,北京100049 [2]中科院计算技术研究所智能信息处理重点实验室,北京100080

出  处:《计算机工程与应用》2006年第24期160-163,共4页Computer Engineering and Applications

基  金:国家自然科学基金资助项目(编号:60435010);国家863高技术研究发展计划资助项目(编号:2003AA115220);中澳科技合作特别基金项目;北京市自然科学基金资助项目(编号:4052025)

摘  要:近年来,随着序列最小优化分类算法SMO等一系列快速算法的推出,支持向量机在自动文本分类研究领域取得了很大的成功。大多数文本分类问题是线性可分的,使用线性核函数的SMO算法能够取得非常好的分类效果。但是文本向量是一种非常稀疏的向量,采用线性核函数的SMO算法对噪声样本非常敏感,容易产生发散的问题。文章分析证明了噪声如何影响SMO算法收敛性。为了解决训练样本中噪声样本影响SMO算法收敛的问题,设计了一个消除噪声样本的算法,取得了非常好的效果。In recent years,accompany with the appearance of a series of rapid training algorithm as Sequential Minimal Optimization (SMO),support vector machines achieved great success in text categorization.Most text categorization problems are linearly separable,and SMO algorithm using linear kernel-induced can perform well for text categorization. However,text vectors are a kind of extremely sparse vector,and SMO algorithm with linear kernel or polynomial kernel is very sensitive to the extremely sparse noisy example,which is easy to bring on the problem that algorithm can not converge.It is been proved that the noisy example how to influence the convergence of SMO algorithm in the paper.To solve the problem that noisy sample in training samples affect the convergence of SMO algorithm,this paper designs the algorithm that can eliminate noisy samples,and good results is achieved.

关 键 词:文本分类 支持向量机 SMO算法 噪声样本 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象