复杂水环境系统水质预测模型的构建与应用研究

【www.zhangdahai.com--其他范文】

侯云龙

(辽宁西北供水有限责任公司,辽宁 沈阳 110000)

人类的生产生活对江河湖泊、水库港湾等水环境会产生重要影响,大部分地区的水质都在逐渐恶化,导致水资源更加紧缺,严重制约着社会经济的可持续发展,因此有必要对这些重要区域的水环境水质进行准确评价和预测[1- 3]。

水库是在防洪、抗旱、发电、供水等方面发挥着不可替代的作用,自新中国成立以来,我国已建成运行各类型水库约10万座,产生了较大的社会效益和经济效益。但是,由于水库上游的工农业生产,很多污染物直接流入河道并长期集聚在水库,造成水库的水质变化,从而影响水库的水环境系统。水库水环境系统十分复杂,不仅受到上游生产生活的影响,而且与降雨、水土流失等因素有关,大量泥沙、污染物以及工农业化学残品聚集在水库中,容易导致水库出现富营养现象,因此有必要对水库水质预测展开研究。关于水质预测,许多专家学者提出了自己的模型和方法,如BP神经网络模型[4]、ARIMA模型[5]、GA-BP神经网络[6]、CNN-LSTM模型[7]、VMD-LSSVR模型[8]等,这些预测模型为水环境水质评估和预测提供了经验方法。但是,由于水库水质因子较多,不同水质因子之间可能会存在多重相关性问题,这会导致信息冗余,从而降低模型预测的准确性,必须要对此进行处理,才能提升模型的预测精度。

针对复杂水环境系统水质预测问题,本文提出了基于偏最小二乘法、灰狼优化算法以及支持向量机的PLS-GWO-SVR水质预测模型,并将其应用到实际案例中,以期能为水库水质的准确评估和预测提供帮助。

1.1 偏最小二乘法

偏最小二乘法(Partial Least-Square method,简称PLS)是一种对多元线性回归分析、典型相关分析以及主成分分析等多种数学算法进行融合和发展的新型优化算法。PLS具有如下优势:可以对多重相关性问题进行建模分析;
当样本数量<变量数量时仍可适用;
在建立的最终模型中将包括所有的自变量;
可以对系统信息和非随机性噪声进行辨识和剔除;
PLS回归模型中的回归系数意义更加明确,更易于理解。

由于水库监测的水质指标通常包括温度、pH值、溶解氧含量等多个指标,各指标之间可能存在一定的相关性,严重时更是会出现多重相关性,造成不同水质因子产生冗余信息和噪声,从而导致水质预测模型的泛化能力降低,但是单纯依靠逐步回归法对多重线性相关性进行消除,由于指标因子太多,需要输入的参数较多,势必会造成水质预测模型运行缓慢,计算分析效率降低。考虑到偏最小二乘法可以解决多重共线问题,因此采用偏最小二乘法对高维度水质因子进行降维,提取输入水质因子和输出水质因子的特征变量,减少水质预测模型的操作步骤,提高计算效率。偏最小二乘法提取水质因子特征流程如图1所示。

图1 偏最小二乘法提取水质因子特征流程

1.2 灰狼优化算法

灰狼优化算法(Grey Wolf Optimizer,简称GWO)按照自然界中灰狼群体的领导层级和狩猎机制进行模拟和分析[9],并根据灰狼群体中各自的功能将其划分为4个等级:α,β,δ,ω,且等级依次降低,α起主决策作用,β起辅助决策作用,δ起领导指挥作用,ω起攻击猎物作用。GWO与其他智能算法相比具有以下几点优势:较强的收敛性能、计算参数少、操作易实现,在车间调度、参数优化、图像分类等领域中得到广泛应用。GWO主要模拟了狼群在狩猎过程中的寻找猎物、包围猎物和攻击猎物等3个步骤。灰狼优化算法流程示意如图2所示。

图2 灰狼优化算法流程

1.3 支持向量机

支持向量机(Support Vector Machine,简称SVM)通过对样本数据的监督学习,并将其进行二元非线性归类的一种方法[10],在人像识别、文本分类、机械控制等领域应用比较普遍。分类仅仅是SVM的最初用法,随着计算科学的不断进步,SVM逐步被应用于回归领域的计算分析,形成支持向量机回归(Support Vector Regression,简称SVR)算法模型,支持向量机回归与其他分类算法不同的是:该算法寻求一个最优超平面,而并非是单纯将不同类的对象进行划分,即寻找的是训练样本数据点离该最优分类面总方差最小的点。SVR算法流程示意如图3所示。

图3 SVR算法流程

1.4 模型构建

基于上述分析,本文将PLS算法、GWO算法以及SVR相结合,构建PLS-GWO-SVR水质预测模型。先将采集到的水质样本数据进行预处理,处理数据缺失和噪声问题,并将数据分为训练集和测试集;
然后利用PLS算法提取水质因子输入变量的特征并将其作为PLS-GWO-SVR水质预测模型的输入变量;
接着利用GWO算法对训练集数据进行参数最优寻找,确定最佳参数(C,g);
再将最佳参数(C,g)代入支持向量机回归中,建立起PLS-GWO-SVR水质预测模型;
最后,将预处理过的测试数据集代入PLS-GWO-SVR水质预测模型中,对模型的预测准确性和可靠性进行测试。模型构建流程如图4所示。

图4 PLS-GWO-SVR水质预测模型构建流程

2.1 研究区概况

某水库始建于1951年10月,是集防洪、灌溉、发电为一体的综合性水利工程,库区控制流域面积约为4.34万km2,装机容量为30000kW,总库容量为41.6亿m3,最大坝顶高程为490m。截至目前,水库已累计供水约420亿m3,累计发电量达到88亿kW·h,拦蓄泥沙量约为6.6亿m3。

2.2 水质数据采样

选取该水库2015年1月—2020年12月取水口处的监测数据作为分析对象,监测数据包括12种,分别为:水温、pH值、氨氮含量、总磷含量(TP)、总氮含量(TN)、氟化物含量、氯化物含量、硝酸盐氮含量、溶解氧含量(DO)、高锰酸盐指数、五日生化需氧量(BOD)以及浊度,采样时间均固定在每月15日,将取样的水样本带回实验室进行分析。

2.3 水质数据处理

本次取样共包含72组数据,由于监测过程存在许多不确定性(如监测人员疏忽、监测材料不合格、周围环境变化),造成监测到的水质数据部分存在维度缺失或者噪声问题,为减小上述情况对预测模型预测精度的影响,提升水质预测的准确性和科学性,需要采取一定的措施进行处理。针对数据缺失问题,采用3次样条插值进行插补,针对数据噪声问题,采用MATLAB数值模拟软件中的移动平均滤波器对数据进行平滑处理,然后对各水质因子进行相关性分析,结果见表1。

表1 水质因子相关系数

由表1可知,温度与DO、高锰酸盐指数、氨氮、TP、氯化物、浊度均呈显著性相关,pH与高锰酸盐指数、TP、TN、氟化物、氯化物、浊度呈显著性相关,DO与高锰酸盐指数、氨氮、TP、氟化物、氯化物呈显著性相关,高锰酸盐指数与BOD、TP、氟化物、氯化物、浊度呈显著性相关,BOD与氨氮、TP、氟化物、氯化物、浊度呈显著性相关,氨氮与TP、TN、氟化物、氯化物、硝酸盐氮呈显著性相关,TP与TN、氟化物、氯化物、硝酸盐氮呈显著性相关,TN与氟化物、氯化物、硝酸盐氮呈显著性相关,氟化物含量与氯化物含量、硝酸盐氮含量呈显著性相关;
12种水质因子之间相互呈中等显著或者强显著相关性,具有高维度的线性共线特征。因此,需要采用PLS算法对水质因子进行特征提取,然后再进行参数寻优和优化,得到最佳的预测模型。

2.4 应用结果分析

总氮(TN)和溶解氧(DO)分别是反映水体有机和无机可氧化物质污染的主要关键指标,从上文分析可知,TN和DO与多种水质因子存在显性相关性,同时由于水质因子太多,进行逐一分析会耗费大量时间,因此本文选取TN和DO作为水体受污染指标,并将前4a(2015—2018年)的监测数据作为训练集,后2a(2019—2020年)的监测数据作为测试集进行分析。

将水温、pH、DO、高锰酸盐指数、BOD、氨氮、TP、TN、氟化物、氯化物、硝酸盐氮、浊度等12个指标分别用x1~x12表示,对总氮和溶解氧的监测数据进行特征提取(由于提取过程繁琐,这里仅列出提取结果),结果分别为:

总氮:

(1)

(2)

式中,t1~t5—第tn个主成分。

将总氮和溶解氧主成分作为预测模型的输入因子,并代入水质预测模型中,选取径向基核函数作为本水质预测模型的SVR核函数,GWO算法的种群规模设置为20,最大迭代次数设置为200次,C和g的范围均为[0.001,100],将训练样本集代入模型,通过分析分别得到了总氮和溶解氧的最优参数分别为(C,g)=(12.50,0.07)、(C,g)=(9.80,0.01)。最终得到的水质模型拟合结果与实际监测值对比情况如图5所示。

图5 模型训练预测值与实际值对比

由图5可知,基于PLS-GWO-SVR水质预测模型可以很好的模拟总氮、溶解氧与水质因子之间复杂的非线性相关关系,不仅在训练集样本中表现很高的拟合精度,而且在测试集样本预测过程中,也可以较好的预测水质因子未来的走势,预测数据与实际监测数据比较接近,符合实际情况。

为了更好地检验所构建的水质预测模型的预测精度和准确度,在相同样本数据情况下,再分别利用PLS-SVR、SVR和BP神经网络3种常见的预测模型进行模拟分析,并与本文提出模型的预测结果进行对比,结果如图6所示。

图6 不同预测模型训练预测结果对比

由图6可知,在4种预测模型中,PLS-GWO-SVR水质预测模型模拟结果与实际监测值最为接近,相对误差更小,且走势更符合实际情况。

根据模拟分析结果,分别计算得到4种模型预测结果的均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)以及相关系数(R2)4个性能参数,结果见表2。

表2 不同预测模型性能指标

由表2可知,对于总氮水质因子,PLS-GWO-SVR与其他3种预测模型(PLS-SVR、SVR和BP)相比,RMSE指标分别降低了70.9%、82%和76.2%,MAE指标分别降低了72%、80.5%和77.5%,MAPE指标分别降低了28.8%、43.1%和72.6%,表明PLS-GWO-SVR水质预测模型在选择最优参数方面明显优于其他模型,拟合相关系数R2分别较其他3种模型提升3.1%、38.9%和84.3%,表明本文提出的水质预测模型预测精度较高;
对于溶解氧水质因子,PLS-GWO-SVR与其他3种预测模型也表现出RMSE、MAE和MAPE指标最小,而拟合度R2最大的结果,同样证实了PLS-GWO-SVR水质预测模型在参数寻优和预测精度方面具有很好的优越性。

针对水环境系统水质因子多、不同水质因子之间存在高维度相关性造成水质预测难度大的问题,提出基于偏最小二乘法、灰狼优化算法以及支持向量机的PLS-GWO-SVR水质预测模型,得出如下结论。

(1)针对水质因子存在多重相关性,易产生信息冗余,提出利用偏最小二乘法对水质输入变量进行特征提取;
针对水环境系统的非线性和不确定性特点,提出利用支持向量机对水质进行全局最优求解;
针对支持向量机寻优过程中核函数选择以及参数选择存在不确定性问题,提出利用灰狼优化算法对参数进行寻优处理。

(2)对某水库2015—2020年监测数据进行缺失处理和去噪处理,通过计算分析证实了该水库水质因子之间存在多重共线性问题,确定了采用偏最小二乘法的必要性。

(3)对比PLS-GWO-SVR、PLS-SVR、SVR和BP神经网络4种模型的预测结果:PLS-GWO-SVR水质预测模型相较于PLS-SVR、SVR和BP神经网络模型在参数寻优和预测精度方面均表现出明显优势,证明了PLS-GWO-SVR水质预测模型合理、可靠。

猜你喜欢氯化物灰狼氟化物铅锌冶炼行业高氟碱性废水除氟技术研究价值工程(2022年19期)2022-06-14茶包含氟化物过多会损害骨骼甚至致癌饮食保健(2019年15期)2019-08-13谷谷鸡和小灰狼小太阳画报(2019年1期)2019-06-11稀土氯化物(镧、钇)在镀镍溶液中的应用表面工程与再制造(2019年1期)2019-05-11欧盟重新评估氯化物作为食品添加剂的安全性食品与生物技术学报(2019年8期)2019-02-15灰狼的大大喷嚏数学大王·低年级(2018年5期)2018-11-01氟离子选择电极法测定化妆品中氟化物的研究化工管理(2017年26期)2017-10-13灰狼照相快乐作文·低年级(2017年3期)2017-03-25甲烷氯化物热氯化反应器防爆膜起爆及安全生产分析当代化工研究(2016年6期)2016-03-20氯化物熔盐体系中Gd的电化学行为及提取效率的评估物理化学学报(2015年5期)2015-02-28

推荐访问:水质 水环境 构建

本文来源:http://www.zhangdahai.com/shiyongfanwen/qitafanwen/2023/0921/657231.html

  • 相关内容
  • 热门专题
  • 网站地图- 手机版
  • Copyright @ www.zhangdahai.com 大海范文网 All Rights Reserved 黔ICP备2021006551号
  • 免责声明:大海范文网部分信息来自互联网,并不带表本站观点!若侵害了您的利益,请联系我们,我们将在48小时内删除!