数据预处理对LSTM网络大气污染预测精度分析  被引量:5

Accuracy Analysis of Air Pollution Prediction for LSTM Network Based on Data Preprocessing

在线阅读下载全文

作  者:杜英魁[1] 张乙芳 原忠虎[1] 关屏 彭跃[3] DU Yingkui;ZHANG Yifang;YUAN Zhonghu;GUAN Ping;PENG Yue(School of Information Engineering,Shenyang University,Shenyang 110000;Shenyang Hengyuan Weiye Environmental Inspection Service Co.,Ltd.,Shenyang 110000;Liaoning Environmental Monitoring Experimental Center,Shenyang 110000)

机构地区:[1]沈阳大学信息工程学院,沈阳110000 [2]沈阳恒源伟业环境检测服务有限公司,沈阳110000 [3]辽宁省环境监测实验中心,沈阳110000

出  处:《计算机与数字工程》2021年第7期1400-1404,1425,共6页Computer & Digital Engineering

基  金:辽宁省重点研发计划指导计划项(编号:2018104013);辽宁省教育厅高等学校创新人才支持计划项目(编号:LR2016074);沈阳市中青年科技创新人才支持计划项目(编号:RC180338)资助。

摘  要:大气污染物浓度数据具有时序性和非线性的特点,针对时间序列数据中的异常值和缺失值问题,进行异常值和缺失值预处理对长短时记忆神经网络(LSTM)预测精度的影响分析。利用箱线图法判别数据序列中的异常值,以均值替换法、回归插补法和多重插补法进行缺失值的预处理,分别利用原始数据序列和不同预处理方法得到的数据序列,对多变量输入LSTM神经网络的大气污染物预测精度进行对比分析。实验结果表明,三种预处理方法均可明显改善LSTM模型的预测精度,多重插补法精度最高。Atmospheric pollutant concentration data is characterized by time series and non-linearity.For the problem of outli⁃ers and missing values in time series data,the influence of outlier and missing value preprocessing on the prediction accuracy of long and short time memory neural network(LSTM)is analyzed.The boxplot method is used to discriminate the outliers in the data sequence,and the mean value replacement method,the regression interpolation method and the multiple interpolation method are used to preprocess the missing values.By using the original data sequence and the data sequence obtained by different pretreatment methods,the prediction accuracy of air pollutants input into LSTM neural network is compared and analyzed.The experimental re⁃sults show that the three data sequence preprocessing methods can significantly improve the prediction accuracy of the LSTM model and the multi-interpolation method has the highest accuracy.

关 键 词:空气污染 时间序列 数据预处理 LSTM模型 预测 

分 类 号:TP183[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象