基于深度学习的沈阳市春节期间PM2.5浓度预测研究

【www.zhangdahai.com--其他范文】

*刘思洋 曹馨元* 刘照 李晓妍

(1.沈阳航空航天大学能源与环境学院 辽宁 110136 2.中国科学院东北地理与农业生态研究所 吉林 130102)

春节是我国历史最为悠久的传统节日,春节期间燃放烟花爆竹已然成为了人民的一项重要的娱乐性活动。但是,在短时间内燃放大量烟花爆竹,不但会导致意外伤亡的事故增加,而且会释放出大量污染物。目前,对于烟花爆竹燃放的研究大多利用地面监测数据及采样数据分析污染物成分及其危害。赵素平等[1]以兰州市为例研究了春节期间颗粒物浓度及其体积浓度谱分布特征,结果表明烟花燃放排放颗粒物体积中位径最大比例在0.93,5.50μm左右。金军等[2]研究发现,烟花爆竹的燃放会导致污染物浓度剧烈增加,监测点PM10最高浓度超过800μg/m3,不仅导致能见度下降,还会造成大气消光作用。烟花排放颗粒物水溶性离子、重金属浓度也会在短期内急剧上升,K+质量浓度最高达到115.6μg/m3,Ba质量浓度最高达到5.168μg/m[3]。洪也等[4]进一步对烟花爆竹燃放排放细颗粒元素进行了分析,结果指出Ba、Sr、K等污染元素浓度在沈阳城区中有明显上升,特别富集在PM1中。大量的污染物不但会导致空气质量的恶化,而且会对人体的健康造成危害[5]。出于环保以及安全的角度考虑,沈阳市人民政府发布了关于春节期间禁止销售和燃放烟花爆竹的通告,因此2020年春节成为沈阳市三环以内城区准许销售和燃放烟花爆竹的最后一年[6]。因此,准确预测烟花爆竹排放颗粒物浓度对于控制节日期间短期急增大气污染至关重要。

目前,颗粒物浓度预测的方法主要包括大气数值模式预测、统计模型预测以及机器学习模型预测[7]。其中大气数值模式预测是通过对PM2.5的扩散方程进行数值求解,统计模型预测包括多元线性回归模型,灰色预测模型,以及时间序列常用的ARIMA模型等。近年来,国内外学者通过构建机器学习模型,提高了预测PM2.5浓度的预测精度。梁锡冠等[8]通过比较几种常见的基于树的集成学习模型预测PM2.5浓度,得到的结论是LightGBM模型预测浓度更优,其次是XGBoost模型,RF模型最差。Kumar等[9]通过改进的AdaBoost算法预测了德尔黑PM2.5浓度,与XGBoost模型相比预测效果更佳。

本研究基于2016年—2022年沈阳市春节期间正月初一前后各15d的逐小时空气质量监测历史数据集,结合相应的气象数据以及时间编码数据对沈阳市春节期间PM2.5浓度进行预测,并且通过4种错误度量标准得出最优模型,为沈阳市烟花爆竹燃放政策的完善以及春节期间空气污染控制提供预报预警作用以及参考,并为沈阳市环境管理部门科学决策提供数据支持。

(1)数据来源

①观测数据

本研究的观测数据主要来自全国空气质量历史数据库网站(http://beijingair.sinaapp.com/#messy),该网站的数据主要来自中国环境监测总站的全国城市空气质量实时发布的数据。本文所采用的监测数据为2016年—2022年正月初一前后各15d的沈阳市包括皇姑区、大东区、沈河区、和平区、于洪区、浑南区、铁西区、沈北新区在内的主城区的9个站点的空气质量指数(AQI)和各常规污染物(PM2.5、PM10、CO、NO2、SO2、O3)质量浓度的逐时监测数据,这些站点包括主要区域、交通干道等类型,所有监测站点均经过GPS定位[10]。

②气象数据

本研究主要通过中国气象数据网(http://data.cma.cn/site/index.html)和rp5.ru天气(https://rp5.ru.com)获得沈阳市2016年—2022年温度(℃),表面大气压(mmHg)、平均海平面大气压(mmHg)、相对湿度(%)、平均风速(m/s)、露点温度(℃)[11]。

(2)研究方法

为了更加合理、准确地评价模型的性能,本研究采用均方误差MSE、平均绝对误差MAE、平均绝对百分比误差MAPE、决定系数R2四种错误度量标准对模型进行评估[12-13]。其中MSE作为回归问题最常用的指标之一,其优点可以非常直观地反映预测值与真值之间的偏差,MAE则能更好的地反映出预测值误差的实际状况,MAPE以百分比表示,可用于比较不同比例的预测,R2度量了因变量中可以被自变量解释的比重,R2越接近1,模型的拟合效果越好。

(1)特征工程处理

PM2.5浓度与时间特征存在一定的相关性,在创建机器学习模型训练的过程中,为了使模型输出的结果能够更准确、更灵活,时间特征也应该被输入到模型中[8]。除进行时间周期性编码外,时间特征还可被当作为离散值进行处理,本研究采用OneHotEncoder对时间特征进行编码并代入模型[14-15]。进行时间变量编码后的结果与PM2.5浓度的相关系数如表1所示。实验表明,沈阳市9个站点年份特征编码对于PM2.5浓度有很强的一致性,其中r-2020均得到了大幅提高,说明沈阳市春节期间的浓度在2020年剧烈增加,而2021年—2022年Pearson相关系数均与PM2.5浓度呈现一定的负相关性。

表1 年份时间编码与PM2.5浓度的相关系数

(2)预测结果分析

对于数据量较大的数据集,为了防止过拟合,通常要进行K-fold交叉验证,但是由于传统的K-fold交叉验证是随机打乱数据集作为训练集的部分,对于时间序列类与时间变量存在极大的相关性数据,会导致时间性关系丧失,从而导致模型的错误。因此,本研究利用了sklearn库中的TimeSeriesSplit类,其中n_splits参数设置为5,意为创建5个不同的时间窗口,其中时间窗口中的数据集为连续的时间序列数据,tiest_size参数取值为300,意为测试集的样本数为300个。同时,为了防止不同的时间窗口中训练集与测试集数据产生交叉,本研究将gap参数设置为48,意为训练集与测试集的数据需要间隔48h。这样K-fold的交叉验证能够直观地判断出模型在不同的数据集上的过拟合情况,以便后续的调参过程处理。

本研究以陵东街站点为例,对六种模型的预测值与真值进行分析,其中4种错误度量标准为进行交叉验证后取得平均值的结果。

从图1中真实值与预测值得结果可以看出,LSTM、GRU模型拟合效果最好,当PM2.5浓度为20~70μg/m3时,各个模型的预测精度都很高,但当PM2.5浓度大于70μg/m3时4种集成学习模型的预测精度开始下降,而深度学习模型的预测精度仍很高,当PM2.5浓度持续增加到大于125μg/m3后,深度学习模型的预测精度开始缓慢下降。由表2可知,LSTM、GRU深度学习模型的4种错误度量标准均小于4种集成学习模型。在4种集成学习模型中LGBM的MSE最小,预测精度最高,RF、XGBOOST其次、GBDT效果相对最差。总体上来讲,六种模型的R2均大于0.9,MAPE均小于20%,MAE均小于0.7,所有模型的精度均为很高水平。从整体上看,深度学习模型比树集成学习模型模拟效果好很多,MSE平均降低了大约44%,其余错误度量标准也均小于树集成学习模型。GRU、LSTM与主流的机器学习模型预测浓度以及相较于传统的空气质量模型预测PM2.5浓度也有明显的优势,并且预测速度更快。

图1 种模型预测值与真实值得对比

表2 陵东街站点6种模型的错误度量标准

(1)通过对比6种机器学习模型的预测情况,得到的结论是GRU模型预测PM2.5浓度的效果最好,其次为LSTM模型,GBDT模型预测PM2.5浓度的效果最差。

(2)GRU模型在沈阳市PM2.5浓度预测中其准确率要高于其他模型,其MSE、MAE、MAPE以及R2分别为32.160、3.413、0.097、0.973。

(3)建立的GRU模型以及LSTM模型其MSE、MAE、MAPE均小于树集成学习模型,R2均大于树集成学习模型LGBM、XGBOOST、RF以及GBDT,表明在预测PM2.5浓度的实验中,深度学习模型要优于常见的树集成学习模型。

猜你喜欢烟花爆竹沈阳市度量沈阳市盛京小学辽宁教育(2023年5期)2023-03-28沈阳市浑南区第八小学辽宁教育(2022年24期)2022-12-28沈阳市浑南区创新第一小学中小学校长(2022年10期)2022-10-29鲍文慧《度量空间之一》上海文化(文化研究)(2022年3期)2022-06-28模糊度量空间的强嵌入数学年刊A辑(中文版)(2022年4期)2022-02-16迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量数学年刊A辑(中文版)(2019年3期)2019-10-08沈阳市新立堡桥设计城市道桥与防洪(2019年5期)2019-06-26北流市加强烟花爆竹安全监管安全生产与监督(2016年10期)2016-11-08地质异常的奇异性度量与隐伏源致矿异常识别中国学术期刊文摘(2016年1期)2016-02-13荷花街道:烟花爆竹“打非治违”重拳出击湖南安全与防灾(2014年12期)2014-02-27

推荐访问:沈阳市 浓度 春节期间

本文来源:http://www.zhangdahai.com/shiyongfanwen/qitafanwen/2023/0917/655781.html

  • 相关内容
  • 热门专题
  • 网站地图- 手机版
  • Copyright @ www.zhangdahai.com 大海范文网 All Rights Reserved 黔ICP备2021006551号
  • 免责声明:大海范文网部分信息来自互联网,并不带表本站观点!若侵害了您的利益,请联系我们,我们将在48小时内删除!