地下水硝酸盐污染已成为世界范围内一个相当普遍的环境问题,在农业活动密集的地区尤为突出。在农业地区,由于粪肥的过度使用,以及在城市环境中,主要由于人类和动物废物的大量输入,都出现了N
O
3
-
-N浓度升高的情况。南四湖流域位于山东省西南部,高度依赖农业、煤炭开采和渔业,在中国北方具有重要的经济意义。近几十年来,由于农业灌溉地表水严重短缺、人口增长和经济发展,南四湖流域地下水氮污染日益突出。本研究应用强大的机器学习方法,特别是特征选择和MLP-ANN,来预测南四湖流域地区的N
O
3
-
-N浓度,并确定影响N
O
3
-
-N的主要因素,为受人为和环境压力影响的半干旱地区的地下水资源可持续管理提供支撑。
论文利用系统采集的422个地下水样,运用水文地球化学分析、主成分分析(PCA)和Duncan比较法等探讨了南四湖流域水文地球化学动态以及土地利用对地下水成分的影响,并利用采用多层感知器人工神经网络(MLP-ANNs)预测 了地下水N
O
3
-
-N污染。研究结果表明,地下水中的主要离子含量空间变异性较高,其中N
O
3
-
-N的波动最为显著。影响地下水水化学成分的因素包括补给源、水岩相互作用、地下水环境、土地利用模式以及相关的人类活动;土地利用类型(主要是农田和农村地区)与N
O
3
-
-N含量密切相关。MLP-ANNs对N
O
3
-
-N的预测精确性较高,AUC达到0.85。研究表明,浅井(<60 m)密集的中部和东南部地区对硝酸盐污染的敏感性较高,主要原因在于氮肥过度施用、农业径流、生活污水排放和化粪池系统泄漏等。在农业集约化耕种的土地下,高渗透性的松散岩石孔隙水系统加剧了这种脆弱性。论文阐明了影响地下水质量的自然过程和人类活动之间的复杂相互关系,为制定促进地下水可持续利用和环境保护的政策与实践提供了有价值的参考。
1 研究区概况
南四湖流域位于中国山东省西南部的典型农业区,陆地面积约3517 km
2
(图1),地势从东向西逐渐倾斜。气候为暖温带季风气候和半湿润大陆性环境,年平均降水量为700 mm,70%的降雨集中在6月至9月。主要土地利用类型为农业用地和居民区,分别占总面积的61.4%和28.6%。
流域含水层系统复杂,受到地层多样性和动态水文相互作用的影响。地层岩性包括第四纪松散沉积物、古生代寒武纪和奥陶纪碳酸盐岩以及太古宙泰山群。根据储水特征和岩性,含水层分为三种主要类型:(1)第四纪沉积物中的松散岩石孔隙含水层,由粉砂、细砂至粗砂和砾石组成,厚度为6-10 m;(2)碳酸盐岩(如石灰岩和白云岩)中的裂隙岩溶含水层,具有中等至较高的涌水量(600-1200
m
3
/d/m);(3)裂隙碎屑岩和侵入岩含水层,产水量有限(<100
m
3
/d/m),风化深度为5-30 m。区域地下水流受地形、岩性和人类活动影响,呈东西向流向南四湖。补给主要通过降水和地表入渗,排泄则受蒸发和抽水影响。整个系统较为复杂,南部和东南部为碳酸盐裂隙含水层,东北部碎屑岩含水层由于孔隙裂隙不发育,导水性较弱,凸显了自然和人为因素的相互作用。
流域地下水呈微酸性至碱性,pH值范围在6.08至10.94之间,平均值为7.79。TDS变化范围为202 mg/L~5985 mg/L,平均值为1438.4 mg/L。氧化还原电位(ORP)在-107.2至357 mV之间,南四湖流域的大多数地下水样品显示为氧化环境。主要阳离子丰度顺序为:Na
+
>Ca
2+
>Mg
2+
>K
+
,主要阴离子丰度顺序为:HC
O
3
-
>S
O
4
2-
>C
l
-
。高N
O
3
-
-N和NH
4
+
-N浓度集中分布于浅层含水层。N
H
4
+
-N浓度在低于检测限至4.94 mg/L之间,大多数样品中N
H
4
+
-N浓度低于检测限。N
O
3
-
-N浓度范围为0.004 mg/L~177.74 mg/L,184个监测点(占总数的43.6%)超过了WHO饮用水限值(10 mg/L)。N
O
3
-
-N的空间变异系数达到149.62%,表明外部因素对地下水中N
O
3
-
-N 含量影响较大。
2 污染源解析与氮含量调控因素
PCA是一种在复杂环境数据中进行降维和模式识别的强大技术,为影响水质的水文地球化学过程提供了关键见解。PC1解释了34.93%的方差,与EC、TDS、C
l
-
、N
a
+
和M
g
2+
等与水矿化相关的变量密切相关,突出了盐度的影响;C2解释了13.22%的方差,与pH、N
O
3
-
-N和C
a
2+
相关,表明其在代表水的酸碱平衡和养分动态方面的作用;PC3解释了8.68%的方差,对
K
+
呈正载荷,对S
O
4
2-
呈负载荷,这表明了人为影响,如农业径流或工业排放。
K
+
通常与化肥有关,而 S
O
4
2-
可能源于工业排放或污水排放。这种相反的载荷可能表明存在不同的污染源,
K
+
与农业径流相关,S
O
4
2-
与工业污染相关,为混合的人为影响提供了证据。PC4的特征值为1.13,解释了7.04%的方差,在pH、N
O
3
-
-N和K
+
上有显著载荷,表明了人为和自然影响的综合作用,可能指示了受农业活动和局部地质特征影响的区域。
图2 地下水样本的
PCA结果(a)和相关矩阵 (b)。
在PCA矩阵中,红色表示正相关,而蓝色表示负相关(显著水平:
p<0.05)。
N
O
3
-
向量与PC1轴正相关(图2a),表明其对方差有很大贡献。这种相关性表明,硝酸盐水平升高与盐度指标(如C
l
-
和 Na
+
)相关,可能源于农业径流或工业废水。相反,F
-
和pH向量与硝酸盐向量几乎相反,表明存在负相关,即较高的硝酸盐浓度可能与较低的
F
-
水平或更酸性的条件同时出现,这通常与农业实践有关。由于使用氮肥,N
O
3
-
与农业活动之间的正相关关系明显。
南四湖流域包含59.78%的耕地,农业耕作密集,河流系统发达。工业和农业废水以及污水随着河流流经该区域,为N
O
3
-
-N提供了来源。在好氧条件下,微生物将N
H
4
+
-N氧化为N
O
3
-
-N,导致N
O
3
-
-N浓度升高。由于地貌、土壤类型和水文地质条件的差异,湖西区(NSW)和湖东区(NSE)呈现出不同的硝酸盐污染特征。泰安和莱芜等城市位于山前冲积平原地区,硝化作用显著。该地区的包气带渗透性好,灌溉或降雨淋滤显著促进了N
O
3
-
-N 通过包气带进入地下水,导致N
O
3
-
-N浓度升高。NSE区的森林覆盖率高于NSW,在水溶性有机氮(Norg)从森林土壤向非饱和带迁移过程中发生硝化作用,从而增加了N
O
3
-
-N浓度。在南四湖附近,N
O
3
-
-N浓度略低,可能是由于河流排放的稀释作用或反硝化作用。
通过分析K
+
、Cl
-
和 N
O
3
-
的关系评估了人为因素对研究区域地下水质量的影响。图3a显示,大多数样品聚集在与生活污水相关的端元附近,表明与农业污染密切相关,这表明生活污水和农业化肥使用对N
O
3
-
污染有显著影响。一些靠近蒸发岩端元的样品也表明地质因素对N
O
3
-
富集有贡献。N
O
3
-
和
K
+
之间的关系(图3b)在大多数样品没有显著相关性,在低N
O
3
-
水平下,
K
+
浓度变化很大。然而,一些样品确实显示出正相关,这意味着受化肥影响的生活污水排放对N
O
3
-
污染起着关键作用。农业活动涉及农用化学品的使用,会导致土壤退化和更多的N
O
3
-
淋滤到地下水中。该地区普遍使用化肥,导致N
O
3
-
浓度升高。地下水中的N
O
3
-
可能来自各种来源,包括富氮沉积物、有机氮输入、废物污染、微生物反硝化和农业化肥,这强调了农用化学品渗透在地下水污染中的重要作用。
图3 地下水中Cl
-
/Na
+
vs NO
3
-
/N
a
+
(a)和(a)以及NO
3
-
/K
+
关系图(b)
3 不同土地利用类型对地下水质的影响
地下水中主要离子与NDVI之间的相关性分析(图4)表明,植被生长和覆盖增加与地下水中C
l
-
、S
O
4
2-
和C
a
2+
浓度降低相关,这归因于植被根系吸收无机离子的能力。Mg
2+
和N
a
+
与NDVI呈现相似的空间分布模式,这两种离子主要来源于岩石(如岩盐和碳酸盐)的风化溶解。此外,采用Duncan多重比较法评估了不同土地利用条件下物理化学指标的变化,一些指标与特定的土地利用条件相关。由于盐碱土壤中盐分含量较高,通过降雨渗入地下水,TDS和C
l
-
在盐碱地中的含量显著较高。
K
+
浓度在农田和建成区最高,可能源于农业化肥和废水是K
-
的主要来源。在C
a
2+
含量方面,林地高于其他土地利用类型,这可能是由于城市和工业地区C
a
2+
的来源多样,包括制革厂、工业和市政废水以及用于除冰的道路盐等输入。在不同土地利用类型中,S
O
4
2-
与农田和盐碱地的关联最为明显。C
l
-
和S
O
4
2-
都受到不同程度的人为活动影响。对于N
O
3
-
-N,与草地有较强的相关性,表明其来源多样,包括废水和农业活动的贡献。
图4 不同归一化植被指数(NDVI)区间内地下水中不同离子的浓度范围:
(a)HCO
3
-
离子,(b)C
l
-
,(c)SO
4
2-
,(d)Mg
2+
,(e)Ca
2+
,(f)Na
+
4 基于机器学习的氮污染预测
构建ANN模型识别了南四湖流域地下水中N
O
3
-
-N浓度升高的关键因素。将数据集的67.8%用于训练,32.2%用于测试,实现了100%的案例处理验证。MLP结构(图5)包括四层,其中有两个隐藏层。输入层包含17个节点,代表关键变量,输出层根据WHO标准对N
O
3
-
-N水平进行二元分类:0(低)和1(高)。
箱线图(图6a)证明模型的准确性。采用灵敏度、特异性和ROC曲线来验证ANN模型在分类低N
O
3
-
-N和高N
O
3
-
-N方面的性能(图6b)。ROC曲线全面展示了模型在不同截断值下的分类性能,通过AUC进行量化。图6c中的AUC作为一个维度指标,基于非参数Mann–Whitney U统计量表示低和高N
O
3
-
-N水平的概率。由所选变量确定的最大AUC值表明硝酸盐作为生物标志物在估计南四湖流域浓度方面具有高预测能力。图6b中基于训练和测试数据的灵敏度和特异性图展示了模型区分低和高N
O
3