激光光谱技术在环境监测中的应用

蔡靖
摘 要: 为了更好地保护环境,将激光光谱技术应用于环境污染的检测中。采用激光光谱技术对环境中的污染物浓度进行检测,得到相应的光谱数据,并对光谱数据进行预处理,然后采用主成分分析降低数据规模,并采用支持向量机对光谱数据进行回归分析,建立污染物浓度检测模型,通过猫群算法对支持向量机参数进行优化,最后应用于对水体污染物的总有机碳浓度检测。仿真结果表明,该模型可以对环境污染物的浓度进行高精度检测,能够快速实现环境中的污染物浓度检测,实际应用价值高。
关键词: 激光技术; 光谱分析; 支持向量机; 主成分分析; 污染物浓度检测
中图分类号: TN2?34; X832 文献标识码: A 文章编号: 1004?373X(2017)11?0179?04
Application of laser spectroscopy technology in environmental monitoring
CAI Jing
(School of Chemical and Materials Engineering, Yanching Institute of Technology, Langfang 065201, China)
Abstract: In order to better protect the environment, the laser spectrum technology is applied to the detection of environmental pollution. The laser spectroscopy technology is used to detect the pollutant concentration in environment to get the corresponding spectral data, and preprocess the spectral data. The principal component analysis is adopted to reduce the data size. The support vector machine is employed to perform the regression analysis for spectral data. The pollutant concentration detection model was established. The cat swarm algorithm is used to optimize the parameters of support vector machine. The model is applied to the total organic carbon concentration detection of water pollutant. The simulation results show that the model can perform the high?precision detection for concentration of environmental pollutant, detect the pollutant concentration in the environment quickly, and has high practical application value.
Keywords: laser technology; spectral analysis; support vector machine; principal component analysis; pollutant concentration detection
0 引 言
隨着我国经济的飞速发展,企业越来越多,环境污染越来越严重,如何对环境中的污染物进行有效检测,引起了人们的高度关注,而有机污染浓度检测是环境监测的一个重要研究方向[1?2]。
为了准确对有机污染浓度检测,国内外学者们进行了广泛的研究,提出了一些有机污染浓度检测模型[3]。激光光谱技术通过光谱强度描述有机污染浓度,因此成为当前一个研究热点[4]。有学者提出采用激光光谱和多元线性回归相融合的有机污染浓度检测模型,通过多元线性回归对有机污染浓度和激光光谱强度之间的关系进行建模,得到了较高的检测精度[5]。然而多元线性回归计算复杂度高,不能满足有机污染浓度的线检测需求[6]。有学者提出采用激光光谱和偏最小二乘法建立有机污染浓度检测模型,得到了较高的检测精度[7]。由于偏最小二乘法是一种线性分析方法,当有机污染浓度和激光光谱强度呈现非线性关系时,检测精度低,检测结果极不可靠[8]。随后有学者提出神经网络、支持向量机的有机污染浓度检测模型,相对其他有机污染浓度检测模型[9?10],它们获得了更优的有机污染浓度检测结果,检测结果更加有说服力,然而在实际应用中,神经网络要求收集大量的有机污染浓度检测样本,增加了实验次数,导致有机污染浓度检测成本急剧增加,难以应用于实践。支持向量机没有神经网络的大样本要求,可以进一步降低有机污染浓度检测效果[11]。激光光谱信息中存在大量的重叠信息,这些重叠信息相当于噪声信息,会对有机污染浓度检测结果产生干扰,因此需要消除这些重叠信息。
为了提高环境的有机污染浓度检测精度,利用激光光谱技术、主成分分析以及支持向量机的优点,提出一种新型的有机污染浓度检测模型,首先采用主成分分析对光谱信息进行降维,提取主要成分,然后采用猫群算法优化支持向量机建立污染物浓度检测模型,实验结果表明,该模型提高了有机污染浓度检测精度,而且获得了比其他模型更优的检测效果。
1 相关理论
1.1 主成分分析
主成分分析算法可以将原始数据从高维空间映射到低维空间,简化原始数据,保持原始数据的基本信息[9]。通过主成分分析对原始数据处理后,数据规模变小,而且数据之间相互独立,不存在重复信息,有利于后续处理,工作步骤如下:
Step1:设原始数据共有个样本,每一个样本均有维,那么相应的矩阵为对所有数据进行标准化处理,避免数量级不同带来的干扰,无量纲后的数据矩阵为;
Step2:计算的协方差矩阵具体如下:
(1)
Step3:计算矩阵的特征值和特征向量
Step4:主成分的贡献率和累计贡献率为:
(2)
(3)
Step5:根据累计方差贡献率确定主成分数量,通常累计方差贡献率要超过85%;
Step6:根据主成分因子载荷矩阵得到原始数据的组合形式为:
(4)
式中为主成分的值。
1.2 支持向量机
设训练样本为那么可以得到如下方程:
(5)
式中:和分别代表权向量和偏置向量。
采用松弛因子和惩罚因子优化式(5)的目标值,则可得到:
(6)
根据拉格朗日乘子和得到凸二次优化问题,具体形式为:
(7)
式(5)的对偶形式为:
(8)
相应的约束条件如下:
(9)
通过上述过程,得到支持向量机的回归形式为:
(10)
通过引入核函数可以有效防止出現“维数灾”问题,式(10)变为:
(11)
1.3 猫群算法
猫群算法(CSO)是一种类似于遗传算法的启发式算法,受到猫日常行为启示提出来的,包括搜寻模式和跟踪模式,工作步骤如下:
Step1:初始化猫群;
Step2:将猫群进行分组,一部分猫为搜寻模式,其他为跟踪模式;
Step3:不同模式的猫执行不同操作模式;
Step4:对猫速度和位置进行更新操作;
Step5:估计每一个猫的适应度值,找出适应度值最高的猫;
Step6:如果满足终止条件,输出最优解;否则返回Step2继续执行。
2 有机污染浓度检测模型的工作步骤
Step1:采用激光光谱仪对有机污染浓度值进行采样和测量,得到相应的实验数据。
Step2:受到样本背景、杂散光等的干扰,数据中存在一些无用信息和噪声,采用标准正态变量变换法提取有效数据,具体为:
(12)
Step3:采用主成分分析对处理后的数据进行分析,选择一些主要成分去除数据之间的重复信息。
Step4:根据提取主要成分对原始数据进行简化处理,减少数据的规模,并将它们分为测试样本和训练样本。
Step5:采用训练样本对支持向量机进行学习,并采用猫群算法对支持向量机相关参数进行在线优化,建立有机污染浓度的检测模型。
Step6:对测试样本进行检测,得到有机污染浓度检测精度。
具体工作流程如图1所示。

图1 有机污染浓度检测模型的工作流程
3 仿真测试
3.1 数据源
选择某污水处理厂作为研究对象,激光光谱的波长范围为180~187 nm,收集水体总有机碳(COD)进行仿真实验,收集到80个样本,如图2所示。30个样本作为测试样本统计有机污染浓度检测精度。
3.2 采用主成分处理数据
采用主成分分析对原始数据进行处理,得到的结果如图3所示,从图3可知,当主成分数量为8时,累计贡献率超过85%,因此,采用8个主成分作为支持向量机的输入,建立有机污染浓度检测模型。
3.3 支持向量机核函数及参数确定选择
在支持向量机的有机污染浓度检测建模过程中,核函数及参数选择至关重要,当前有许多类型不同的核函数,常用核函数有多项式、径向基函数等,它们具体为:
(13)
(14)

图2 COD的浓度

图3 主成分分析的结果
对多项式函数、径向基函数的性能进行分析,得到的曲线如图4,图5所示,从图4和图5可以发现,相对于多项式函数,径向基函数的学习能力强,因此选择径向基函数建立有机污染浓度检测模型。

图4 径向基函数的曲线图
采用猫群算法对径向基函数的参数和支持向量机参数进行优化,得到最优值为采用和建立有机污染浓度检测模型。
3.4 实验结果与分析
选择文献[11?12]的模型进行对比实验,采用均方根误差(RMSE)和相关系数对有机污染浓度检测精度进行分析,它们的定义如下:
(15)
(16)

图5 多项式函数的曲线
不同模型的RMSE和的结果如表1所示,对表1进行对比和分析可以发现,相对于文献[11?12]的有机污染浓度检测模型,本文模型的RMSE的值更高,这表明有机污染浓度检测精度更高,而值更大,表明本文模型的有机污染浓度检测结果与实际值更加接近,可以更准确地描绘有机污染浓度和激光光谱强度之间的关系,具有明显的优势。





表1 不同模型网络流量预测误差比较
[模型名称 RMSE 文献[11]模型 16.60 0.947 文献[12]模型 15.39 0.952 本文模型 13.46 0.969 ]
4 结 语
为了提高环境污染物检测的准确性,采用激光光谱技术提取污染物浓度的光谱数据,并采用主成分分析提取重要数据,然后采用支持向量机对光谱数据进行回归分析,最后进行了具体水体污染浓度检测实验,结果表明,本文模型提高了环境污染物浓度的检测精度,具有一定的实际应用价值。
参考文献
[1] KESHAVNA N, MUSTARD J F. Spectral unmixing [J]. IEEE signal processing magazine, 2002, 19(1): 44?57.
[2] PLAZA A, DU Q, BIOUCAS?DIAS J M, et al. Foreword to the special issue on spectral unmixing of remotely sensed data [J]. IEEE transactions on geoscience and remote sensing, 2011, 49(11): 4104?4111.
[3] BIOUCAS?DIAS J M, PLAZ A, DOBIGEON N, et al. Hyperspectral unmixing overview: geometrical, statistical, and sparse regression?based approaches [J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2012, 5(2): 354?379.
[4] 徐霞,成芳,应义斌.近红外光谱技术在肉品检测中的应用和研究进展[J].光谱学与光谱分析,2009,29(7):1876?1880.
[5] 任晓东,雷武虎.基于光谱区分法的高光谱核异常检测算法[J].光子学报,2016,45(3):3?7.
[6] 褚小力,袁洪福,陆婉珍.用于石化工业的光谱和波谱类过程分析技术[J].现代科学仪器,2006(3):8?13.
[7] 于意仲,周小玉,张帆,等.紫外差分光学吸收法测量污染气体的实验研究[J].环境科学学报,2003,23(5):630?634.
[8] 刘文清,崔志成,刘建国,等.大气痕量气体测量的光谱学和化学技术[J].量子电子学报,2004,21(2):202?210.
[9] 杜树新,蒋丹红,李林军.基于支持张量机回归的三维荧光光谱法水体有机污染物浓度检测[J].高技术通讯,2014,24(1):80?85.
[10] 杜树新,杜阳锋,武晓莉.基于三维荧光导数光谱的水体有机污染物浓度检测[J].光谱学与光谱分析,2010,30(12):3268?3271.
[11] 聂劲松,张为俊,杨勇,等.激光光谱技术在环境监测中的应用专题系列(Ⅳ)激光光谱学方法测量大气中OH自由基[J].物理,2002,31(1):31?35.
[12] 吴元清,杜树新,严赟.水体有机污染物浓度检测中的紫外光谱分析方法[J].光谱学与光谱分析,2011,31(1):233?237.