三种回归分析方法在Landsat—5影像森林碳密度反演中的比较

郭晓妮 刘晓农 宋亚斌 邢元军 江腾宇



摘要:随着遥感技术的快速发展,基于遥感影像和地面样地的方法成为目前森林碳密度精确估算的主要手段,然而没有找到具有普适性的建模因子和最佳的森林碳密度估算模型。鉴于此,本文通过分析研究区地面固定样地碳密度与Landsat-5影像及其衍生波段的相关性,筛选出估算森林碳密度的敏感因子。采用三种回归分析方法(逐步回归、偏最小二乘回归及非线性回归)分别建立森林碳密度的最优遥感估算模型。结果表明:①参与建模的遥感因子中,1/TM3与森林碳密度的相关性最大,敏感性最高;②三种回归分析方法建立的预测模型中,以4个遥感因子建立的非线性回归模型预测精度最高,预测值与实测值得决定系数R2为0.74;③通过测算,研究区平均森林碳密度为14.36 t/hm2,变化范围介于0.00~38.28 t/hm2之间。研究表明非线性回归在区域森林碳密度反演方面具有一定的潜力。
关键词: 林业遥感;回归分析;相关性分析;Landsat5影像;森林碳密度
中图分类号:S757.2 文献标识码:A 文章编号:1004-3020(2016)04-0017-05
Abstract: With the fast development of remote sensing technology, the method based on remote sensing image and sample plots has become the major means of accurate estimation of forest carbon density. However, there were still no universal factors and optimal models for the estimation of forest carbon density. The objective of this paper was to study the estimation of forest carbon density by combining plots data and remote sensing images of Landsat-5 using the methods of stepwise regression, partial leastsquares regression and nonlinear regression respectively. First, various remote sensing factors derived from Landsat5 images were generated using different transformations such as band ratios, vegetation indices calculation, principal component analysis and texture transformation. Then, effective remote sensing factors were selected to conduct the estimation of forest carbon density, according to the correlation analysis between the fixed sample plots and factors derived from Landsat5 images. Finally, the accuracy of Landsat5 derived maps was assessed using R2, Root Mean Square Error and Relative Error. The results showed that ①the correlation coefficients of 1/TM3 with plot values was the highest. ② Among the built models, the effect of nonlinear model built by four remote sensing factors was the best with R2 of 0.74. ③The mean value of forest carbon density of research area was 14.36 t/hm2, ranging from 0.00 to 38.38 t/hm2. This implied that nonlinear regression showed a certain potential in the aspect of region estimation of forest carbon density.
Key words: forestry remote sensing; regression analysis;correlation analysis;Landsat5 image; forest carbon density
作为陆地生态系统的主体,森林通过与大气环境交换二氧化碳,在全球碳循环和气候变化中发挥着重要作用。森林碳密度是理解和分析全球碳循环的基础,也是研究全球变化的关键途径。因此,如何快速地对区域森林碳密度进行精确估算已成为国内外学者广泛关注的重大议题[1-4]。
近年来,国内外学者围绕森林碳密度估算开展了大量研究,归纳起来比较常用的有:物理模型[5]、经验模型[6-9]。物理模型法主要以PROSPECT+SAIL模型为主,从物理机理角度反演生物物理参数[10-13]。基于经验统计模型的森林碳密度估算是利用卫星遥感数据获取的参数信息与森林样地碳密度进行统计分析,建立两者的经验关系来估算碳密度的一种方法。物理模型(过程模型)具有很强的通用性,然而输入参数过多,需长时间多尺度的站点观测数据[14],目前区域森林碳密度的遥感反演涉及不多。同物理模型相比,经验模型法虽然存在模型参数随时间或地点变化的缺陷,但因其简单、计算效率高、容易实现的优点,广泛用于森林碳密度的遥感估测。归纳现有经验模型的研究成果可知,森林碳密度反演回归模型以单因子的线性与非线性回归居多,大部分研究只采用一种回归方式,使用多种方法进行比较的研究较少。
鉴于此,论文以固定样地和Landsat5影像为数据源,采用逐步回归、偏最小二乘回归和非线性回归三种方法开展湖南攸县森林碳密度的反演研究,同时对3种方法所得结果进行对比,旨在分析不同回归分析方法的特点,找出对森林碳密度反演敏感性高的遥感因子。
1 材料与方法
1.1研究区概况
湖南省东部的攸县,地处东经113°04′~113°43′,北纬27°04′~27°06′之间。境内四季分明,雨水充足,土壤肥沃,中亚热带季风湿润气候常绿阔叶林带,年平均气温17.8℃,无霜期292 d,年降水量1 410 mm左右。全县现有林地166 866.7 hm2,其中森林蓄积量和森林覆盖率分别达到311.87 m3和57.24%。
1.2 数据来源及处理
1.2.1 遥感数据
研究采用的遥感数据为中分辨率的Landsat5影像,空间分辨率30 m×30 m,轨道号123/41,接收时间2009年8月21日,含云量0.66。采用ENVI 4.7软件对Landsat5数据进行预处理,包括辐射校正、大气校正、几何校正和地形校正4个步骤。其中几何校正每景影像选取24个控制点,总体误差控制在半个像元之内;地形校正采用从双向分布函数角度出发的Minneart模型进行,其在非朗伯体基础上同时考虑了太阳和传感器的空间光学信息,结果表明Minnaert模型明显消除了地形对Landsat5影像的影响,达到了较好地消除效果。
1.2.2 固定样地数据
以2009年湖南省森林资源连续清查固定样地调查数据为测算样本,根据攸县森林资源分布情况,将固定样地和遥感影像叠加,剔除被云覆盖的样地,最后保留78块样地作为研究样本,计算样地碳密度。样地面积为25.82 m × 25.82 m,样地调查因子包括地貌特征、土壤类型、植被类型以及与森林生物量相关的优势树种、胸径等测树因子75个,研究涉及的样地因子主要包括纵坐标、横坐标、海拔、样地类别、地类、龄组、优势树种、平均树高和平均胸径。
1.3 研究方法
1.3.1 森林碳密度的计算
研究基于湖南攸县森林资源一类调查数据,采用李海奎等[15]2010年建立的回归模型,分树种组计算样地生物量,经济林、灌木林采用平均生物量法求得,其平均生物量分别为23.7 t/hm2、19.76 t/hm2[16];混交林生物量,针叶混交林、阔叶混交林、针阔混交林分别按比例(6杉4马、5软阔5硬阔、3.6杉2.4马2软阔2硬阔)计算,含碳率取0.5。对无明确模型的树种,采用近似树种参数替代。为方便后续精度验证工作的开展,研究通过随机抽样将样本数据分为两部分,其中三分之二的数据(52块样地)作为建模样本,三分之一的数据(26块样地)作为验证样本。
1.3.2 变量设置与筛选
借助遥感手段估计森林碳密度分布,国内外学者已做过大量研究,其关键步骤是依据数据源的特征提取合适的遥感变量。在前期数据预处理基础上,选取Landsat5的6个波段TM1、TM2、TM3、TM4、TM5和TM7分别进行倒数运算、比值运算(包括两波段、三波段和四波段组合间的比值运算)、植被指数(包括NDVI、SAVI、ARVI和EVI四种指数)运算、主成分变换和纹理变换(包括均值、角二阶矩、对比度、相关、相异、熵、逆差距和方差8种纹理因子),共生成88种基于Landsat5的遥感变量。为筛选合适的遥感因子,研究运用ArcGIS 10.0软件提取固定样地所在位置的遥感变量,采用SPSS 20.0软件计算样地森林碳密度值和遥感变量间的Pearson相关性和方差扩大因子,保留相关性高且独立性高的遥感变量参与后续回归建模。
1.3.3 反演及建模
森林碳密度的反演分三个阶段进行:首先,分析建模因子与试验区森林碳密度的相关性,开展逐步回归分析建模和偏最小二乘回归建模(PLSR);其次,在上述建模分析基础上,选择与森林碳密度相关性最高的建模因子开展单变量曲线估计,确定最佳曲线拟合模型,然后逐步引入新的自变量,建立多变量的非线性回归模型,确定森林碳估计的最佳非线性回归模型;最后,对三种回归建模方法开展精度评价与分析。其中逐步多元回归和非线性回归采用SPSS20.0软件实现,PLSR采用SIMCAP11.5执行,具体PLSR建模分三步进行:①分析参与建模的样本点是否存在特异点;②通过计算交叉有效性和累积解释量,确定潜在建模变量的个数;③开展森林碳密度的偏最小二乘回归分析。
1.3.4 精度验证
基于地面调查样地的森林碳密度估计在由单木水平、样地水平推算到区域水平的过程中存在大量的不确定性,忽略这些不确定性将导致区域森林碳密度的高估或低估。本文采用3个指标对Landsat5:判定系数(R2)、均方根误差和估测精度。R2反映的是估测值与对应的实测值之间的趋势线拟合程度;均方根误差(RMSE)用于衡量估测值与实测值之间的偏差,能够很好地反映估测模型的可靠性;估测精度值(EA)越大模型估测精度越高。
2 结果与分析
2.1 样地数据分析
根据森林碳密度测算结果,对样地碳密度进行统计(表1)。分析可知,研究区25.82 m×25.82 m固定样地碳密度在0.00~39.27 t/hm2之间变化,标准差为8.39 t/hm2,且变异系数大于1.00,属于强变异程度,说明各样地森林碳密度存在较大的差异,数值分布合理。
2.2 相关性分析
采用SPSS 20.0分别计算样地碳密度与遥感变量间的Pearson相关性,结果显示基于Landsat5的遥感变量与样地碳密度的相关性分别介于-0.455~0.497之间,表2列出了相关系数排在前8位的遥感因子。对于Landsat5数据,当显著水平在0.01时,与森林碳密度达到显著相关的变量有1/TM3、TM1var、Elevation、1/TM2、TM5、TM7mean等15个因子,其中1/TM3、1/TM2、1/TM1和TM2mean四个因子相关系数在0.450以上,特别是与1/TM3的相关性水平最高,达0.497;从方差扩大因子来看,VIF值大于10的有1/TM1、TM2mean等,其中最大值达到44.57,说明自变量间存在严重的多重共线性,研究采用逐步剔除法消除自变量间的多重共线性问题。经过筛选,研究最后保留13个因子参与森林碳密度的回归建模:1/TM3、TM47、Elevation、TM7ent、NDVI、TM2con、TM2、TM3ent、1/TM5、TM1mean、PCA1、TM357、TM4mean。其中TM47=TM4/TM7,TM357=(TM3+TM5)/TM7,Elevation表示海拔,TM7ent、TM3ent分别表示TM7、TM3波段灰度共生矩阵的熵,TM2con表示TM2灰度共生矩阵的对比度,TM1mean、TM4mean分别表示TM1、TM4灰度共生矩阵的平均值,PCA1表示主成分分析的第一分量。
2.3 模型构建
在相关性分析的基础上,采用SPSS20.0和SIMCAP11.5软件分别构建研究区森林碳密度的多元逐步回归分析模型和偏最小二乘回归模型(表3)。为深入研究Landsat5遥感因子与森林碳密度的关系,笔者提出利用非线性回归方法开展森林碳密度的反演。首先基于前期筛选的遥感因子,采用SPSS20.0软件中的11种拟合方法开展基于单变量的非线性回归,保留单变量最优曲线拟合模型(表3公式(3))。在单变量最优曲线拟合基础上,以自变量与森林碳密度的相关性分析结果为参考,逐步引入新变量建立基于多变量的非线性回归模型,经过多次运算和模型选取,森林碳密度的非线性最佳拟合结果(表3公式(4)),该模型的调整R2最高达0.580。
2.4 精度评价
精度评价是衡量森林碳密度反演模型效果的重要步骤。首先分别计算三种回归方法所建模型的决定系数(R2)和所建模型的残差,检验模型预测值和实际观测值是否存在较好的线性拟合关系,以及残差是否落在置信带内[-2σ^,2σ^];其次根据26个验证样本计算三种回归方法的均方根误差和估测精度。具体精度检验结果(表4)。
分析可知非线性回归效果最好,R2为0.74,估测精度最高,达74.87%;其次是偏最小二乘回归(R2、估测精度分别为0.70和71.53%),逐步回归效果最差(估测精度仅69.27%),同时三种回归方法的均方根误差分别为3.06,3.46,3.74,该结果与模型拟合分析结果一致,说明利用非线性回归模型建立的估测模型效果最好。图1给出了非线性回归模型预测值与实测值的散点图,分析可知非线性回归模型拟合效果较好(R2为0.74),残差分析结果与模型拟合效果一致,多元非线性回归的残差图散点分布比较均匀,说明非线性回归的拟合效果最好。
2.5 反演结果分析
为进一步评价模拟结果的正确性,研究将森林碳密度模拟结果与地面样地值叠加(图2),进而直观反映模拟结果与地面样地值的吻合程度。结果表明攸县森林碳密度的模拟结果整体上与地面样地实测值保持一致的分布趋势:即由东向西逐渐减少,东部分布大面积的针叶成熟林,森林碳密度高;越向西,森林碳密度越低,最低值出现在湖泊所在的位置。酒埠江附近的大面积连续森林碳密度高值分布,充分反映了森林植被随地表水分布的规律;而中南部和北部大面积的连续低值分布,则反映出人类活动对森林植被覆盖的影响。采用ArcGIS 10.0软件的“Summary statistics”工具进行统计可知,湖南攸县2009年平均森林碳密度达14.36 t/hm2,具有一定的可信度和实用性。
3 结论
采用逐步回归、偏最小二乘回归和曲线估计方法对湖南攸县森林碳密度进行估测,结合地面样地调查结果,分析了森林碳密度与Landsat5遥感因子、地形因子的关系,建立了森林碳密度的回归分析模型。采用R2、RMSE和相对误差3个指标对回归结果进行精度检验,结果表明:①参与建模的遥感因子中,1/TM3与森林碳密度的相关性最大,敏感性最高,其次是1/TM2、1/TM1和TM2mean;②三种回归分析方法建立的3个预测模型中,以4个遥感因子建立的非线性回归模型预测精度最高,预测值与实测值得决定系数R2为0.74,其次是偏最小二乘回归,逐步回归的拟合效果最低,预测值与实测值的决定系数为0.68;③通过测算,湖南攸县平均森林碳密度为14.36 t/hm2,整体上空间格局与植被分布规律保持一致,即由东北向西南逐渐减少,最低值出现在西南部酒埠江所在的区域;④研究所选建模因子基本上为遥感因子,且构建的回归分析模型多为线性模型,有关非线性模型和非遥感因子的引入,有待进一步探讨。
参 考 文 献
[1]Steffen W, Sanderson R A, Tyson P D, et al. Global Change and the earth system: a planet under pressure [M]. Springer Berlin. 2006:1100.
[2]Houghton Jt, Y Ding, Dj Griggs, et al. IPCC, 2001: Climate Change 2001: The Scientific Basis. Contribution of Working Group I to the Third Assessment Report of the Intergovernmental Panel on Climate Change [J]. Cambridge, United Kingdom, New York, USA, Cambridge University Press, 2001, 881: 9.
[3]Canadell J G, Robert Dickinson. Global Carbon Project. Science Framework and Implementation [J]. Global Carbon Project. Science Framework and Implementation. Earth System Science Partnership, 2006: 80.
[4]钟寻. 海南: 三年恢复海防林 [J]. 中国林业, 2007(6A): 1415.
[5]Chiesi M, Maselli F, Bindi M, et al. Modelling carbon budget of Mediterranean forests using ground and remote sensing measurements [J]. Agricultural and Forest Meteorology, 2005, 135(1): 2234.
[6]Hudak A T, Lefsky M A, Cohen W B & Berterretche M. Integration of lidar and Landsat7 data for estimating and mapping forest canopy height [J]. Remote Sensing of Environment, 2002, 82(2): 397416.
[7]Sun G, Ranson K J, Guo Z, Zhang Z, Montesano P, & Kimes D. Forest biomass mapping from lidar and radar synergies [J]. Remote Sensing of Environment, 2011, 115(11): 29062916.
[8]严恩萍,林辉,洪奕丰,等.杉木人工林叶面积指数估测及影响因子分析[J].水土保持研究,2013,20(4):7581.
[9]董立新,吴炳方,唐世浩.激光雷达GLAS与ETM联合反演森林地上生物量研究[J].北京大学学报,2011,47(4):703710.
[10]蔡博峰,绍霞.基于PROSPECT+SAIL模型的遥感叶面积指数反演.国土资源遥感,2007(2):3943.
[11]Jacquemoud S. Inversion of the PROSPECT+SAIL canopy reflectance model from AVIRIS equivalent spectra: theoretical study. Remote Sensing of Environment, 1993, 44(2/3): 281292.
[12]刘照言,马灵玲,唐伶俐.基于SAIL模型的多角度多光谱遥感叶面积指数反演[J].干旱区地理,2010,33(1):9398.
[13]陈艳华,张万昌,雍斌.基于分类知识利用神经网络反演叶面积指数.生态学报,2007,27(7):27852793.
[14]Peng C, Liu J, Dang Q, et al. TRIPLEX: a generic hybrid model for predicting forest growth and carbon and nitrogen dynamics [J]. Ecological Modelling, 2002, 153(1): 109130.
[15] 李海奎. 中国森林植被生物量和碳储量评估[M].北京:中国林业出版社,2010:120.
[16]吴丹,邵全琴,刘纪远,等.1985~2030年江西泰和县森林植被碳储量的时空动态[J].应用生态学报,2011,22(1):4146.
(责任编辑:郑京津)
相关文章!
  • 浅谈财政体制改革对农业与农村

    朱钇澜【摘 ? 要】 财政体制改革对于国内经济持续稳定发展发挥着积极的作用,很大程度上推动了地方经济建设。近几年来,党中央以及财务部

  • 低盐胁迫对红鳍东方鲀幼鱼肝脏

    孙梦蕾姜志强蒋洁兰王莉苹摘 要:为探讨低盐胁迫下肝脏在红鳍东方鲀(Takifugu rubripes)机体免疫中的作用,在肝脏酶活性、组织结构和基

  • 基于高职高专院校畜牧兽医专业

    陆艳凤++孙国波++张响英++章敬旗++张海波摘要:针对高职高专院校畜牧兽医专业实用型技术人才的培养,开展在教学模式和技能培训等方面的