-
河流水质评价是河流开发与利用的基础工作,是河道污染治理的必要措施[1]。目前常用的水质评价方法有单因子评价法、综合污染指数法、物元分析法、灰色系统评价法、水污染指数法、模糊数学评价法、综合水质标志指数法和人工神经网络法等[1-4]。由于河流污染种类、来源的复杂性,水质监测指标多样性,可能导致河流水质评价过程计算量过多,水质分析过于繁杂[5-6]。多元统计分析方法具有客观性强、简化数据结构、分析结果可靠等优点[5],适用于对复杂污染物、多评价指标的分析。主成分分析与聚类分析是常见的多元统计分析方法,在水质评价方面应用十分广泛。王红等[7]利用SPSS软件和主成分分析法得到梁子湖区水质主要影响因子以及综合水质评价函数。郑群威等[8]利用主成分分析法和绝对主成分多元线性回归分析法筛选了影响乌江流域水质的主要因子,并量化各污染物的贡献率。PARINET et al[9]采用主成分分析法研究了Yamoussoukro湖泊富营养化特征,将描述富营养化的大量参数缩减为4个。GUO et al[10]利用主成分分析法对焦作矿区地表水以及地下水污染状况进行研究,识别了影响水质的主要污染变量。申震等[11]采用系统聚类分析对高邮湖进行水质评价,筛选出关键污染因子和主要污染源。汤云等[12]采用聚类分析、因子分析等多元统计方法研究了闽江流域河流中污染物来源以及水质时空分布特征。TEMINO-BOES et al[13]对墨西哥湾南部的红树林河口和其他湿地进行氮污染评估,基于灰色聚类法提出了灰色总氮管理优先指数和灰色土地利用压力指数。HAJIGHOLIZADEH et al[14]采用系统聚类法对南佛罗里达州三条主要河流的水体污染状态和时空变化特征进行评估。
常州市属于典型平原河网地区,土地利用类型众多,污染来源复杂,水质状况应采用多元统计方法进行评价。针对研究区域内水质监测断面与监测指标较多较复杂的情况,本文采用单因子评价进行水质整体评价,采用主成分分析与聚类分析结合的综合分析法,对研究区域进行水质统计评价和污染特征分析,为常州河流水环境管理提供科学依据与技术支持。
全文HTML
-
常州市位于江苏省南部、长江三角洲中部,地跨太湖流域湖西区和武澄锡虞区,常州境内河网纵横交错,湖、荡、塘、库星罗棋布,支流密布,形成了江河相通,湖泊相连的水系网络,属于典型的平原河网地区。常州属于北亚热带海洋性气候,常年气候温和,季风影响显著,由于季风影响显著,降水与气温相应同步升降。“十三五”期间,常州市在全市范围内设定了国家级考核和省级考核的河流断面共26个,断面内水质监测与考核指标如DO、CODMn和NH-N3等21项,常州市河流断面逐月水质监测数据即为研究数据来源。
-
针对研究区域内水质监测断面与监测指标较多较复杂的情况,本文采用单因子评价法和综合分析法2种方法对常州地区河流水质进行综合评价与污染特征分析。
-
单因子评价法是采用最差的水质单项指标所属类别来确定水体综合水质类别,是《地表水环境质量标准:GB3838—2002》采用的水质评价方法[15]。本文采用单因子评价方法,对每个断面进行水质分级,计算断面超标指标以及超标倍数等特征值,并采用《地表水环境质量评价办法(试行)》[16]中的断面类别比例法进行整体水质状况评价分级。
-
主成分分析是一种降维、简化数据的技术,通过研究众多变量之间的内部依赖关系,使用少数几个综合变量来表示其基本的数据结构。聚类分析是针对研究对象,按照其某些相似性或差异性进行分类,以便系统地加以科学研究的一种有效方法,层次聚类算法是最常用的聚类算法。本文提出的综合分析法是一种结合主成分分析与层次聚类分析的多元统计分析方法,能够在降维指标变量和聚类监测断面的基础上进行水质综合评价与污染特征分析。主成分分析与聚类分析过程都在SPSS22.0数据统计分析软件中完成。
(1)指标变量标准化。评价指标之间量级不同,需要将进行主成分分析的变量进行标准化,见式(1)。
式(1)中,
${x_{ij}}$ 和${c_{ij}}$ 分别为第i个水质样本的第j个指标的标准化浓度值和实际浓度值;$\overline {{c_j}} $ 和${\delta _j}$ 为第j个水质指标的样本均值与标准差。(2)相关系数矩阵计算。假定研究区域有n个断面样本,m个水质指标,相关系数矩阵,见式(2~3)。
式(2)和(3)中,R为相关系数矩阵;
${r_{ij}}$ 为第i个指标与第j个指标的相关系数。(3)主成分提取。计算相关系数矩阵特征值λ和特征值方差贡献率。将特征值按照从大到小排序,基于特征值大于1,方差累计贡献率要在70%以上的原则确定主成分个数。
(4)主成分得分计算。建立主成分因子载荷矩阵,计算各主成分得分,以方差贡献率作为权重计算综合得分。假定共提取k个主成分,综合得分,见式(4)。
式(4)中,Z和b分别为全体主成分的综合得分和累计方差贡献率;
${y_i}$ 和${b_i}$ 分别为第i个主成分得分与方差贡献率。(5)聚类分析。基于样本主成分得分,选用最远邻元素距离算法进行样本层次聚类。
1.1. 研究区域背景
1.2. 水质评价方法
1.2.1. 单因子评价法
1.2.2. 综合分析法
-
水量对水质的影响较大,河流水质评价必须考虑降雨对水质状况的影响。对常州市2010~2019年气象数据进行分析,发现近10年年降水量序列在2016年出现最大值,因此本研究选定2016年水质监测数据作为研究对象。常州市年内降雨量分为枯、平、丰3期,其中1~3月、10~12月为枯水期,4~6月为平水期,7~9月为丰水期,丰水月降雨量约占全年的60%。根据常州市水期划分与2016年逐月降雨量序列,选定3月和9月监测数据进行丰水、枯水月份的水质评价与对比。常州市“十三五”期间在全市设定26个国考省考河流断面,21项考核指标。以Ⅲ类水限值作为标准,对21项水质指标的逐月监测数据进行分析,发现其中8项指标超限次数较多,分别为DO、CODMn、COD、BOD5、NH3-N、TP、挥发酚和石油类等。综合研究区域初步分析结果,选定2016年3月和9月常州市26个国省考断面8项考核指标监测数据,进行丰水、枯水月份的水质评价与污染特征分析。
-
对常州市2016年9月(丰水月)与3月(枯水月)水质状况进行单因子评价,根据DO、CODMn、COD、BOD5、NH3-N、TP、挥发酚和石油类8项重点水质指标月均值进行水质类别划分和超标项目与超标倍数计算,其中根据《地表水环境质量评价办法》[16],DO项目不计算超标倍数,见图1。
从丰水月单因子评价结果可看出,全断面水质类别范围在Ⅲ类水和Ⅴ类水之间,超标指标为CODMn、COD、BOD5、TP、挥发酚、石油类等6项。Ⅲ类、Ⅳ类和Ⅴ类水断面数分别为7、17和2,占总断面数百分比分别为26.9%、65.4%和7.7%。2016年9月常州市河流断面整体水质定性评价为轻度污染级别。
分析枯水月数据,发现全断面水质类别范围在Ⅱ类水和劣Ⅴ类水之间,超标指标为CODMn、COD、BOD5、NH3-N、TP、挥发酚和石油类等7项。Ⅱ类、Ⅲ类、Ⅳ类、Ⅴ类和劣Ⅴ类水断面数分别为1、4、11、7和3,占总断面数百分比分别为3.9%、15.4%、42.3%、26.9%和11.5%。2016年3月常州市河流断面整体水质定性为轻度污染级别。
-
根据常州市26个河流断面8个水质指标逐月监测数据,采用综合分析法,进行水质综合评价。由于不同水质指标单位量级不同,需要对原始数据进行标准化,由于DO指标数值越低水质越差,故将其倒置处理后采用z-score方法进行标准化处理。
-
通过SPSS软件对丰水月数据进行主成分分析与处理。选择SPSS软件中的分析-降维-因子分析功能,导入标准化后的8个水质指标监测数据,选择相关矩阵分析和主成分方法,并保存因子得分系数矩阵,设定完成后软件会自动计算水质指标的相关性矩阵特征值与方差贡献率,主成分因子载荷矩阵和主成分得分。根据主成分提取原则,提取前3个主成分,解释了83.6%的数据,计算结果,见表1和表2。
第一主成分(F1)方差贡献率达到42.2%,远大于第二主成分(F2)22.7%和第三主成分(F3)18.6%的方差贡献率,是影响水质的最主要成分。CODMn、COD、BOD5、NH3-N和TP在F1上的载荷较大,CODMn、COD是水体有机物污染参数,BOD5是微生物代谢耗氧参数,也能表示水体有机物污染程度,NH3-N和TP是水体氮磷营养盐的参数,能表明水体的富营养化程度,因此F1代表了水体有机污染和富营养化程度。挥发酚、石油类在第二主成分(F2)上的载荷较大,挥发酚主要来源于煤气洗涤、炼焦、合成氨、造纸、木材防腐和化工行业的工业废水;石油类主要来源于石油的开采、运输、装卸、加工和使用过程中的泄漏和排放;F2代表了工业污染对水质的影响;DO和TP在第三主成分(F3)上的载荷较大,溶解氧含量表明水体自净能力的强弱,一定程度反映水体受污染程度[7],TP主要来源于生活污水、化肥和有机磷农药,F3代表河流自净能力与生活污水、农业面源对水质的影响。
基于SPSS软件计算得到主成分方差贡献率各断面主成分得分,根据公式(4)进行各断面综合得分计算,计算结果,见图2(a)。
根据各断面的3个主成分得分进行SPSS聚类分析,选用SPSS软件的分析-分类-系统聚类功能,选择变量为主成分得分值,勾选个案聚类和聚类谱系图,聚类算法选择最远邻元素,距离测量方法选择欧式平方距离。分析聚类谱系图可将河流断面分为6个集群,聚类结果,见图2(b)。
分析断面主成分得分与谱系图,集群1成员有6个,主成分得分均较低,表明断面水质状况较好;集群2有7个成员,F2得分较高,表明水体受工业污染程度较高;集群3成员有6个,F1得分较高,表明河流受水体有机污染和富营养化程度较严重;集群4有5个成员,F3得分较高,表明其断面DO含量低,水体自净能力较差;集群5只有1个成员即芳泉村断面,F1和F3得分较高,受有机污染和富营养化影响较大,DO含量低,且综合得分最高,断面水质极差;集群6只有1个成员即杨巷桥断面,F1得分极高,水体受有机物污染、富营养化程度较高,但F2和F3得分极低,表明其受工业污染影响小,水体自净能力强,其污染程度处于中等水平。
-
枯水月的主成分分析过程与丰水月大致相同,提取了3个主成分解释了81.5%的数据,计算结果,见表3和表4。
主成分因子载荷矩阵中,F1方差贡献率达到39.4%,远大于F2的26.9%和F3的15.2%方差贡献率,是影响水质的最主要成分。CODMn、COD、BOD5、NH3-N在F1上的载荷较大,F1代表水体有机物污染与富营养化程度。DO、TP和挥发酚在F2上的载荷较大,因此F2可以看做是工业、生活和农业污染以及水体自净能力的综合影响指标;石油类在F3上的载荷较大,表征石油化工行业污染对河流水质的影响。
计算枯水月主成分得分,根据得分对河流断面进行层次聚类,将其分为5个集群,主成分得分与聚类结果,见图3。
分析断面主成分得分与谱系图,集群1有8个成员,其F3得分极高,断面受石油化工行业污染影响,综合得分较高,水质状况较差;集群2有6个成员,其主成分得分均为中等水平,水质状况一般;集群3有7个成员,主成分得分均较低,表明其水质状况较好;集群4成员有4个,分别为百渎港、钟溪大桥、裴家和五牧断面,F1得分最高,断面主要受水体有机物污染与富营养化程度影响,其综合得分较高,水质较差;集群5只有1个成员即青洋桥断面,其F1和F3得分均较低,但F2得分极高,综合得分较高,表明水体DO含量极低、TP和挥发酚含量极高,断面水质较差。
2.1. 水质指标选取
2.2. 单因子水质评价
2.3. 综合分析法水质评价
2.3.1. 数据预处理
2.3.2. 丰水月综合评价
2.3.3. 枯水月综合评价
-
本文通过单因子评价法和水质定性评价分级对常州市26个河流断面进行了水质类别划分和整体水质状况定性评价;通过主成分分析法和聚类分析法对多断面样本多评价指标的监测数据进行分析,研究常州市河流断面丰水月和枯水月的污染特点,并对其根据水质特点进行集群分类。
单因子评价结果表明,常州市2016年丰水月河流断面水质均处于Ⅲ类水和Ⅴ类水之间,存在6项主要超标污染物,河流整体水质状况评价为轻度污染;枯水月断面水质类别处于Ⅱ类水和劣Ⅴ类水之间,存在7项主要超标污染物,河流整体水质状况评价为轻度污染。枯水月与丰水月评价结果进行比较分析,相比于丰水月,枯水月的超标污染物增加,Ⅲ类水和Ⅴ类水占比减少,Ⅴ类和劣Ⅴ类水占比增加,整体水质状况更差。
综合分析法水质评价结果表明,常州市河流监测断面在丰水月受到3个主成分影响,分别为水体有机污染和富营养化程度(F1),工业污染排放(F2)和河流自净能力与生活农业废水排放(F3),断面整体水质受F1影响最大,根据污染特征(即F1、F2和F3得分)将26个断面分为6个集群。枯水月的水质特征与丰水月存在一定差异,主要受3个主成分影响,水体有机物污染与富营养化程度(F1),工业、生活和农业污染以及水体自净能力的综合作用(F2)和石油化工行业污染(F3),整体水质受F1影响最大,河流监测断面分为5个集群。
对断面样本较多和水质指标较复杂的研究区域进行水质评价时,采用主成分分析与聚类分析等多元统计分析方法,可以组合复杂的水质指标,利用主成分携带原始数据大部分信息,对大量的断面样本进行集群分类,达到简化变量、简化样本的目的,从而识别不同断面的主要水质特点与污染特征,在水质管理施策时便能做到因地制宜、对症下药。