检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]山东师范大学信息科学与工程学院,济南250014
出 处:《计算机工程与应用》2010年第12期126-128,共3页Computer Engineering and Applications
基 金:山东省中青年科学家科研奖励基金(博士基金)(No.2006BS01020);山东省高新技术自主创新工程专项计划(No.2007ZZ17);山东省自然科学基金No.Y2007G16;山东省科技攻关计划No.2008GG10001015;山东省教育厅科技计划项目No.J07YJ04~~
摘 要:目前很多数据挖掘和机器学习方法都有一个基本假设:训练数据和测试数据必须服从相同的分布。但是在很多情况下这种假设不成立,没有考虑分布差异的传统机器学习方法就不能正确分类了。提出了一种新的迁移学习方法DRTAT,对原训练数据进行动态分割重组,适时地淘汰冗余数据,并进行分类器的集成。通过在多个文本数据集和UCI数据集上进行测试,并与TrAdaboost算法进行比较,表明了算法的先进性。There is a basic assumption in many existing data mining and machine learning techniques,that training and test data must be governed by the same distribution.However,this assumption does not hold in many cases,then traditional machine learning methods not aware of the difference of distribution may fail.This paper proposes a novel transfer-learning algorithm called DRTAT,which dynamically regroups the primary training data sets and eliminates the redundancy data timely,then makes classifiers ensemble.The experiments are performed on many text data sets and the UCI benchmark data sets,and DRTAT is compared with TrAdaboost algorithm,the results show the superiority of DRTAT.
关 键 词:分布差异 知识迁移 动态数据集重组 冗余数据淘汰 分类器集成
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229