检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙涛[1] 吴海丰[1] 梁志刚[2] 贺文[3] 张镭[4] 吕平欣[5] 郭秀花[1]
机构地区:[1]首都医科大学公共卫生与家庭医学学院,北京100069 [2]首都医科大学宣武医院,北京100053 [3]首都医科大学附属友谊医院,北京100050 [4]首都医科大学附属朝阳医院,北京100020 [5]首都医科大学附属北京胸科医院,北京101149
出 处:《北京生物医学工程》2012年第5期528-530,共3页Beijing Biomedical Engineering
基 金:国家自然科学基金(81172772);北京市自然科学基金(4112015);北京市属高等学校人才强教计划资助项目(PHR201007112)资助
摘 要:目的临床数据在分析时多存在不平衡性,即阳性数据和阴性数据不相等,如果不加以预处理会使分析结果产生偏倚。处理有偏性数据的方法多,但多数方法存在过拟合或丢失数据等缺点。方法本文介绍了SMOTE算法的原理和R语言具体实现方式,并用SMOTE算法处理真实临床数据作为应用实例。结果原始数据良恶性比率为1/3,经过SMOTE算法处理后,良恶性比率为1。结论 SMOTE算法可对不平衡数据进行有效纠偏。Objective Unbalanced data which means inequality between positive and negative data, is a common problem in clinical data analysis, and this problem may result in bias. Methods for balancing data are various, yet some may over fit or lose data. Methods In this paper, SMOTE arithmetic and the application in R language were introduced briefly and we used SMOTE arithmetic for real unbalanced data. Results The ratio between benign and malignant cases was 1/3 in original data and the ratio was I in balanced data. Conclusions The SMOTE arithmetic has good performance in balancing data.
分 类 号:R318.04[医药卫生—生物医学工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222