检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:方宏彬[1,2] 赵立权[3] 周瑛[3] 张铃[3]
机构地区:[1]安徽大学数学系 [2]安徽大学人工智能所,合肥230039 [3]安徽大学人工智能所
出 处:《计算机工程与应用》2006年第18期47-49,共3页Computer Engineering and Applications
基 金:安徽省高等学校青年教师科研资助计划资助项目(编号:2004jq103)
摘 要:样本训练集的选取对网络分类精度及泛化能力有很大影响,同样对回归分析中的两难问题“偏差-方差”影响很大。经典的简单抽样理论在现实中很难做到,数据之间关系受到噪音以及领域知识的限制而显得很复杂,尤其是离群点的影响不能忽视。故而有限样本集中学习,如何获得最优结果不仅与算法有关,且与样本集的选取有关。文章首先从学习的数学理论出发阐明样本训练集的选取方法必要性,进而提出样本选择的鞅性要求与样本训练集中的离群点定义,最后提出在无监督学习中,混合密度分布有限样本集且样本类别数不知情形下的聚类与离群点判别算法,试验结果表明该算法的可行性与有效性。The selection of training sample set has some influence on classification precision and generalization ability of neural networks as well as "bias-variance" dilemma of regression analysis.Classical simple sampling theory cannot carry out in reality because of noise affection and domain knowledge limitation,especially outliers affection,so that optimal result is relative to not only algorithms but also selection of sample set under the condition of finite samples.In this paper,the selection of training sample set is necessary in light of mathmatical learning theory firstly,martingale criterion about selecting samples and outliers definition are brought up secondly,and at last a kind of outliers detection algorithm is proposed based on unsupervised learning.The analysis of a simulated data shows that the algorithm can effectively detect samples produced by different mechanisms,namely outliers.
分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117