基于DMSP/OLS的人口分布网格精细化研究

郭山山 龚俊 尹晶飞



摘要:采用浙江省已有的乡镇级行政区域面属性数据、乡镇级的建筑物数据和灯光数据,利用加权计算的方法,得到了浙江省250m×250m的网格人口分布数据。与传统公里网格人口分布数据进行对比,所得到的网格数据不仅能有效体现出人口分布特征,而且能适用华东地区的中小地震灾害评估。
关键词:人口分布;建筑物分布;250m×250m网格;DMSP/OLS夜间灯光数据
中图分类号:P315-39 文献标识码:A 文章编号:1000-0666(2016)02-0321-06
0 引言
人口密度是表现人口分布的主要形式,获取不同尺度上高精度的人口分布信息对于发生重大灾害时的应急救援工作意义重大。近几年浙江省时常发生具有一定社会影响的震群事件,例如2006年2月4日在温州文成一泰顺交界地区发生了ML4.6的震群活动,给当地造成直接经济损失9000多万元,2014年同一位置又发生ML4.8地震震群。所以对突发性的地震事件我们要一直保持警惕,积极作好应急准备工作。
长期以来地震工作者通过不同方式来防御和减少地震带来的损失,目前主要有两种手段(李东平等,2011a,2011b),一是进一步加强地震预测工作、做好震前防御工作,二是在突发地震事件后提高反应能力,使受灾人员得到及时救助,救灾工作高效有序,迅速恢复和重建灾区(范开红等,2014)。一旦地震发生,各有关部门急需震区灾情信息,以指导应急和救灾工作(苏幼坡,刘瑞兴,2000)。因此,各相关部门在地震灾害应急过程中,要做到行动迅速、准确、高效。如果不能及时了解灾情,就无法有针对性地提供救援,就会造成重大的损失。日本阪神地震后对灾情的错误评估(危福泉等,2005),错过了抢救的最佳时机,导致了更多的人员伤亡和财产损失。
地震灾害损失盲估,是在震后尽量短的时间内,根据平时建立的模型方法和有限的现场信息,给出损失的快速评估结果,以便政府和有关部门根据灾害规模做出应急对策,部署救灾行动,争取外援。其主要要求是速度快,但不苛求十分精确(李智,王晓青,2010)。现今,如果在经济发达、人口稠密的浙江省发生一次破坏性地震,通常需要一周以上的时间才能得到评估结果,其产生的灾害损失就将大大增加,还可能会导致政府职能的发挥失常,甚至政府的信任危机等各种弊端也会接踵而至。相反如果在地震发生后,能在最短的时间内准确估算出地震灾害损失的分布、大小,就可以为政府提供科学的应急决策依据,积极有效地组织实施抢险救灾行动,最大程度上减少经济损失并挽救成百上千人的生命(李平,罗云,1994),同时有效提升政府的公众形象。因此,地震灾害损失快速评估是必要的。
为了提高地震灾害损失快速评估的水平,笔者将对浙江省的人口网格数据进行紧细化、实时化研究。
1 浙江省数据源及数据预处理
基础地理信息数据是进行空间分析、模型模拟以及专题制图的基础,笔者利用现有的浙江省行政区划数据、人口分布数据、建筑物数据、夜间灯光数据等来模拟浙江省人口的空间分布。
1.1 行政区划数据
笔者使用的行政区划数据来源于2013年浙江省地震局地震应急基础数据库。按照该数据库结构,行政区划数据分为地市代码库、区县代码库和乡镇代码库。这3类数据中的属性库部分,包含浙江省11个地(市)、90个区(县、市)、1324个乡、镇、街道行政区划,数据表中包含有行政区划代码、行政区名称等。空间库为shp格式,投影方式为经纬度。空间库与代码库一一对应,并完成关联。
1.2 人口分布数据
浙江省人口分布数据来源于浙江省地震局地震应急基础数据库中的乡镇人口统计表(街道办事处),其中包含浙江省1324个乡、镇、街道的人口统计数据,ID与浙江省行政区划数据中的乡镇代码库的ID对应,并完成关联,数据保存为mdb格式。人口分布数据包括行政区名称、总人口、家庭户户数、大于65岁人口、0~14岁年龄人口和居住本地、户口在本地人口数。
2013年底,浙江省常住人口约为5494万人,全国排名第10,人口密度为540人/km2,居全国第8位。从分区域来看,浙江省人口比重最大的分别是温州市、杭州市和宁波市,3个地(市)的人口总数占全省人口总数近一半,位于浙江省西南方的丽水市由于地处山区,人口分布相对稀疏。
图1为浙江省地震局应急数据库中2013年乡镇人口分布图。从图中可以看出,浙江省东、西部的人口数差距很大,东部一个乡镇的人口数大于25000人,而部分西南山区乡镇的人口数却小于15000人。
1.3 建筑物分布情况
地震中建筑物的倒塌造成大量的人员伤亡,建筑物分布能够实时反映人口聚居以及分布情况。根据《2013年浙江省国民经济和社会发展统计公报》(浙江省统计局,国家统计局浙江调查总队,2014),浙江省城镇居民人均住房建筑面积38.82m2,农村居民人均居住面积60.82m2。浙江省测绘与地理信息局提供2013年浙江省1:1万房屋外廓分布图,包含浙江省全省的建筑物,反映出浙江省建筑物的分布情况。
1.4 建筑物分布与人口分布对比
图2为浙江省各地(市)总人口与总建筑面积归一化分布图。从图中可以看出两条折线具有明显的相似性,因此在一定程度上,建筑物面积与当地人口总数是成正比的。
1.5 夜间灯光数据
美国DMSP(Defense Meteorological SatelliteProgram)卫星的OLS(Operational Linescan Sys-tem)搭载在DMSP卫星上,以14轨/d的速度覆盖地球一周,能获取全球范围的黎明、白天、黄昏和夜晚4个时段的影像数据。OLS传感器有可见光和热红外2个通道,其中可见光波段范围为0.4~1m,光谱分辨率为6bit,灰度值范围0~63。OLS具有很强的光电放大能力,能够探测到地表的城市灯光、辉光、极光、闪电和火光等,OLS传感器每天都能获取覆盖全球的黑夜和白天的图像,在夜间工作时对可见近红外光高度敏感,其量级是普通传感器的4倍,高增益性能使OLS传感器探测城镇灯光等发出的电磁波,因此在国外已被应用于城市监测,火灾监测等研究(何洋等,2014)。
目前,DMSP/OLS夜间灯光影像主要用于城镇扩展研究、社会经济因子估算以及其他环境、灾害、渔业、能源等领域(米晓楠等,2013)。自1992年,OIS传感器获取的数据在美国国家地理数据中心由美国空军和NOAA处理成为数字格式的文档,并通过相应程序研发生成夜间灯光影像数据,其数据每年1幅大小约为2.7GB,分辨率为0.00833°(约0.93km)。
由于DMSP/OLS数据在低灰度值(<3)的数据受噪声干扰比较严重,因此笔者对3~63级灰度值进行阈值处理。笔者下载1992~2010年的数据进行分析,图3为杭州市部分地区夜间灯光影像及
2 浙江省细网格人口分布研究
Sutton(1997)、卓莉等(2005)研究发现,人口密度与夜间灯光数据及建筑物具有较大的关系。在一定程度上,夜间灯光数据越高代表本地人口密度越大,建筑物越多代表本地人口密度越大,反之亦然,但单一的元素不能够很好地反映较精细化的人口密度。
为了使各地人口更加接近实际情况,笔者选取250m×250m网格的人口密度情况进行研究,具体实施步骤如下:
(1)建立数据库。将调查搜集到的浙江省各乡镇人口数据、全省建筑物分布情况数据、全省夜间灯光数据等,建立属性数据库。
(2)人口数据的处理。根据《区域级抗震救灾指挥部地震应急基础数据库格式规范(修订稿)的规定,数据的编码系统为14位,编码的前9位与乡镇代码库的ID对应。在处理浙江省2013年乡镇街道人口数据前还需要检查空间和人口数据的年份、数量、编码是否一致,检查无问题后,使用ArcGIS Toolbox中的链接功能,使人口和空间数据进行匹配,匹配成功后就可以根据含有人口属性表的空间数据计算出浙江省的人口密度,进而统计分析人口分布影响因子。
(3)建立基础剖分网。网格是进行人口数据网格化研究的目标,是各类参数载体以及各种空间分析的主要对象。本研究基于ArcGIS与Matlab,构建了250m×250m的规则网格以均匀覆盖浙江省各个乡镇。
(4)单元网格点数据处理方法。对单元网格进行空间分析,考虑单元网格内所有影响因子的累积影响,将单个单元格的数据拓扑到所在单元网格中心点上,通过加权叠加等空间分析方法获取各个单元格对应的人口密度数据。应用空间分析模块对单元网格中心点上人口密度数据进行分析,获取该单元格对应的人口密度。
①在每个250m×250m的网格中,将该单元格中心点对应的夜间灯光数据表示为Li、建筑物面积数据表示为Bi、乡镇的人口数据Pi为该网格所在乡镇的人口数:②一般情况下可以认为灯光数据Li越大代表本处高层建筑物越多,假设单个250m×250m网格的Wi等于该网格中建筑物面积Bi与夜间灯光数据Li的乘积(式(1));分别将各乡镇Wi相加获取∑Wi,而每个网格的实际权重Wi'等于Wi除以∑Wi(式(2));③任一250m×250m的网格计算得到的人口数Pi'等于该乡镇的实际人口数Pi乘以该网格的实际权重Wi'(式(3))。
依据上述评价方法,获取浙江省250m×250m网格人口密度分布,见图4。
2013年浙江省的统计人口总数5494万人,由上述方法经过网格化、数据分析加权等过程得到的浙江省总人口数为5472万人,分布在约101800km2的区域内,约有67260km2区域无人居住。
3 成果对比
中国科学院地理科学与资源研究所利用第6次普查数据以及GIS空间分析技术生成了浙江省1km×1km网格人口数据(陈振拓,2012),如图5所示。
在实际情况中,公里网格人口密度存在一定程度的不足,没有考虑乡村的存在及对人口分布的影响。其主要原因是无法科学地确定如村级居民地的平均人口密度及其影响半径。在插值时如果能够合理地考虑上述因素对人口密度的影响,最终结果可能会更接近真实。
对比中国科学院地理科学与资源研究所制作的2010年1km×1km网格人口分布以及本文的250m×250m网格人口密度分布。对图4和图5中杭州市部分城区及人口分布情况作放大处理,如图6所示。
图6a为杭州市部分地区250m×250m网格人口分布情况,图6b为杭州市部分地区1km×1km网格人口分布情况。
从图3可以看出,杭州市上城区、下城区建筑物较为密集,与此同时灯光数据也相对来说较大。这反映出,杭州人口分布较密集的地区集中在传统意义上的老城区:上城区、下城区以及萧山区,而钱塘江周边由于尚未完全建设成熟以及西湖景区限制导致人口分布较为稀疏,这种分布与图6一致。
但是,相较于250m×250m网格人口分布,1km×1km网格人口分布图在精度上存在一定程度上的不足。以图6中部分地区为例进行分析:(1)钱塘江及其沿岸区域,钱塘江作为浙江省最大的河流流经杭州市,其所在区域必没有人口居住,这种情况在图6a中反映很准确,图6b中则反映不是很明显;(2)西湖景区,西湖作为杭州著名的旅游胜地,由西湖及其周边群山组成,在图6a中我们几乎可以准确地判断出西湖及其周边群山的位置,但是在图6b中却较难反映:(3)富阳市部分区域,为检验富阳市人口数据网格化结果的精度,本文对富阳市人口数据与网格化的人口数据结果进行对比验证。实地调查依据公里网格所确定的250m×250m范围进行,对结果精度进行检验。结果显示,富阳市人口较之萧山及上城区、下城区少,而图6b显示富阳市人口与萧山区人口相差无几。
为验证本文提出的250m×250m网格人口准确性,特在全省范围内随机选取8个乡镇街道进行对比实验。将乡镇街道实际人口数与网格化后人口数进行对比,实验结果如表1所示。
由上述实验结果可知,本文250m×250m网格人口分布在一定程度上较为准确。网格化后的数据与实际人口对比存在一定程度上的差异,可能是由于网格化的数据在乡镇边界部分隶属于两个乡镇。
综上所述,本文研究的250m×250m网格人口分布较1km×1km网格人口分布更加精确、细致,且本文的研究成果与实际情况较为一致。
4 结论
笔者将原本以乡镇级行政区为统计单位的人口以及建筑物分布数据转化为规则网格点上的人口密度及单位面积人口。然后,依据建筑物及夜间灯光数据分析该网格化获取数据的正确性。通过研究结果的统计分析,得到以下结论:
(1)本文对浙江省人口分布情况做了具体分析,从海拔看,浙江西南山区人口分布较为稀少,水系穿过的区域也均无人口分布。浙北平原地区以及东南沿海平原地区人口密集:从城市来看,杭州、宁波以及温州部分地区人口分布相对密集,而丽水等地相对人口较为稀疏。
(2)本文得到的浙江省250m×250m网格人口密度分布较为合理地反映了浙江省单元行政区内部的人口分布情况。可以看出:在浙江省各个行政单元内部,城镇街区建筑物分布密集、乡村建筑物呈现片状零散分布,而偏远农村的建筑物分布稀疏,这3类建筑物的分布与本文所生成的高值、中间值和低值人口密度区有较好的空间耦合关系。具体来说,城镇地区的人口空间密度形态为片状,并依地形分布,城镇的边缘地区沿交通干道线状辐射:乡镇和农村地区人口分布以沿水系、道路分布为特征。同时本文将部分乡镇实际人口与网络化人口进行对比分析,生成的人口密度数据质量具有较高的精度,达到了预期效果。
(3)本文获取的250m×250m网格数据较之前的1km×1km网格人口及人口数据精确且细致。相较于传统公里网格人口数据不够严密的特点,本文获取的人口数据更加真实,且更加能反映实际人口分布情况。