Chen P, Wang B, Wu Y, et al., 2023. Urban river water quality monitoring based on self-optimizing machine learning method using multi-source remote sensing data[J/OL]. Ecological Indicators, 146: 109750. DOI:10.1016/j.ecolind.2022.109750.
河流是城市成长的必需品,城市河流为城市提供了丰富的水源,作为交通通道在城市经济发展中发挥着重要作用( Larsen等,2016 )。然而随着城市化进程的加快,城市规模迅速扩大,大量人口向城市迁移,导致大量生活污水、工业废水排入城市河流,这些问题削弱了城市水生态系统,水质不断恶化( McGrane,2016;Miller and Hutchins,2017 )。量化水质参数浓度是未来城市河流水质监测和污染源调查的重要途径。遥感技术是监测城市河流水质的重要手段之一,但存在样本量不足、多源信息尺度不一致等问题。解决这些问题将为环保部门、城市规划部门和水利部门合理利用水资源、防治水污染提供科学依据。
目前,采样点水质参数浓度主要通过单点监测确定(Mentzafou等,2019;Yamaguchi和Fujii,2020),该方法虽能准确检测出各项水质指标浓度,但费时费力,且应用后无法追溯污染来源(He等,2021)。遥感技术具有时效性高、监测范围广等优势(Schaeffer等,2013),结合实测水质数据,可应用于水质参数的定量反演,弥补传统水质监测的局限性,在长期和大尺度上反映水质在时空上的分布规律(Arabi等,2020;Gohin等,2019)。随着遥感技术的不断发展,基于遥感的水质监测已从定性分析走向定量分析(Pahlevan等,2017)。由于研究目标和研究区域地理位置的差异,为提高水质参数浓度的反演精度,学者们考虑选取不同的遥感影像数据进行水质浓度的定量反演(那志强等,2021;群欧等,2021;谢志强等,2006)。例如在利用Sentinel-2影像反演总氮(TN)、NH3-N(董文等,2020)、利用GF-1C影像反演总磷(TP)(陆志强等,2020)中,反演结果均表现出较高的精度。虽然卫星遥感数据可以监测大面积的水体,但由于分辨率较低,无法获取像元的真实值。同时实测数据有限,导致对卫星数据的反演效果不理想(Xu et al.,2020)。无人机具有成本低、灵活性强、低空飞行等特点,搭载在无人机上的高分辨率多光谱相机能够不受云层影响,提取小微水体的高质量光谱信息,且反演精度较高,间接说明了无人机水质遥感反演的实用性(Chen et al.,2021;Lu et al.,2021;Pyo et al.,2022),但也受到采集范围的限制(Wei et al.,2020)。
遥感水质反演方法的原理是结合光谱信息和水质参数浓度信息构建反演模型,将光谱信息转化为相应水质指数的浓度( Ampe等,2015 )。传统水质反演方法主要通过实测水质数据与遥感反射率的相关性分析建立回归模型,选取不同波段或波段组合建立回归公式,常用的模型主要有线性、多项式、对数、指数等( Yu等,2016 )。但这类基于统计学原理的方法往往每次水体监测都需要大量的数据,甚至需要重新构建模型,得到的数据集不一定符合线性回归模型的要求,可能存在非线性关系,比如复杂的城市内陆河流。机器学习是水体监测领域的一种流行方法(Zhang et al.,2022),拥有众多算法,例如支持向量机(SVM)(Tang and Huang,2021)、随机森林(RF)(Liu et al.,2021)、反向传播(BP)神经网络和套索回归(Hou et al.,2022),并且可以通过对这种非线性规律进行编码,将多个输入特征相乘以构造特征组合,从而解决复杂的非线性关系(Hadjisolomou et al.,2021)。机器学习技术已被开发用于识别和预测藻类。例如,一些学者采用改进的ANN和SVM方法来准确预测海洋藻华的生长和富营养化,但SVM需要更多的训练时间(Deng et al.,2021)。机器学习在监测水质指标中的非水色参数时也表现出独特的优势(AlDahoul等,2022;Alizadeh等,2018)。例如,利用当前先进的机器学习算法BP和RF实现了总氮、总磷和化学需氧量浓度的高精度反演。这些机器学习方法可以对Chla、TUB、NH3-N、TP、TN等取得较好的反演结果(Kouadri等,2021;Shamshirband等,2019)),同时,水质参数浓度与遥感反射率之间的非线性映射关系能够被训练数据很好地拟合出来,这说明机器学习比传统回归模型具有更明显的优势,但是机器学习中参数较多,在参数优化过程中往往需要相当长的调整时间(Kim等,2014)。