七人普前谈大数据应用的必要性
摘?要:在防控常态化、经费压减、人工成本提升的大环境下,人口普查的艰巨性和复杂性超乎想象。人户分离、空挂户口、一户多房等情况普遍存在;外出务工、城市拆迁等造成人口迁移流动数量大、频率高;人口居住地不稳定,人口结构日趋复杂,“候鸟式”的人户分离和流动人口,不确定登记时点的居住地和准确的离开时间,极易造成现住、常住人口的漏登或重复登记。部门资料没法“拿来就用”,部门行政资料不能满足人口普查工作的需要。如何提高信息采集的准确率国家统计局不断进行创新与尝试,大数据的应用被提到了请所未有的高度。
关键词:人口普查?大数据?必要性
中图分类号:C924.25?文献标识码:A?文章编号:1003-9082(2020)10-0-01
第七次全国人口普查工作已经进行到了区划绘图收尾阶段,这次人口普查工作是中国特色社会主义进入新时代后的一次重大国情国力调查,是事关国民经济和社会发展规划制定,完善人口发展战略和政策的大事。在我国第一个百年奋斗目标即将实现的重要历史节点,人口发展进入重要转折期开展的重大国情国力调查,可以说是和平时期最大的社会动员,是深入贯彻落实中央关于统计改革发展重大决策部署的一项重要任务,也是制定我们区“十四五”国民经济和社会发展规划,完善人口发展战略和政策,推动全区高质量跨越式发展的重要依据。
这次人口普查将全面查清各地的人口数量、结构、分布、住房等方面的情况,并且人口在普查登记时一方面需要在“户籍地”和“现住地”分别进行登记;另一方面在普查登记时需要对“户籍地”和“现住地”选项间的逻辑关系进行判断以及跨县流动的人口还要填写具体的县级及以上的地址。长期以来,我国的人口数据一直具有多种来源,而且划归不同的部门进行管理,各部门根据自身工作特点,单独进行收集和使用。如公安部門的户籍人口和暂住人口数据,卫计部门的出生人口、育龄人口数据,民政部门的贫困人口和死亡人口数据,等等,这些部门的统计口径和数据采集方式不一,对于人口数据的管理和使用也各具特点,相互之间未能进行充分的数据共享。受制于数据的各种局限性,其整合应用一直存在较大的难度。如何应对新需要,有效运用大数据来提高普查的数据质量必将成为新的研究重点。
一、传统人口数据的特点
1.数据的不健全
由于数据来源的多样化,每一个部门只能收集自身某一领域的数据,而对于超出行政管理权限范围的数据就难以采集,除每十年一次的人口普查,对于全域范围的人口会有一个彻底的清查外,其余年份的人口数据,大多有着相当的局限性。
2.口径的各异
如对于常住人口,公安部门一般所说的常住人口就是指户籍人口,而统计部门的常住人口是以居住地为标准的;同样的,对于出生人口,卫计部门就有两个口径,一是户籍出生人口,二是医院统计的落地活产婴儿数,不管其户籍在哪里,都在统计范围。
3.共享的局限性
由于当前对于人口数据要求的不断提高,各部门都有一定程度的数据共享,但共享具有较大的局限性。一是受限于数据保密等原因,使得数据无法完全共享,二是受限于数据本身,无法达到共享的要求。
4.缺乏有效的整合
由于没有统一的人口数据管理部门,对于散落于各部门的数据整合,只能是出于需要而进行的各部门间主动共享,数据的整合能力严重缺乏,不能使各类数据有效的融合起来,成为一种信息储量较高、适用范围广泛的有效的战略资源。
二、大数据的特性与优点
大数据区别于传统数据,具有大量、高速、多样、低价值密度以及真实等五个特性,对数据处理的要求非常高。而能够有效运用于人口统计的大数据,我们认为具有以下三个特性:一是大容量,如图片信息、视频信息等在现代信息处理设备中,比传统的数据需要占用更多的空间;二是间接性,即难以进行直观的数字化表达,如人们的偏好选择、位置信息、活动轨迹等信息,如转化为数字信息,就会失去直观的意义。三是整合程度高,对其处理时相关分析多于因果分析,需要进行极为烦琐的去伪存真,才能发现真实的规律。因而大数据的应用就存在着较高的技术门槛,往往要依赖于强大的技术力量和庞大的基础数据库。在大数据炙手可热,已经成为发现问题、把握规律、科学决策并提供最终方案的重要依据,成为一种重要的战略资源的前提下,将大数据技术运用于人口统计,使两种战略资源有效整合,必然会给我们发现问题、分析问题和解决问题带来质的变化。
三、符合大数据特性的新型人口数据
由于新兴技术手段的迅速发展,人口数据已经不仅仅局限于行政管理部门。如中国移动、中国联通、中国电信等三大运营商所拥有的移动电话所有人信息,就已经是比较全面的一种人口数据资源,配合其强大的技术手段,移动电话用户活跃情况、位置信息、移动轨迹等大数据信息已经成了真正具有较大价值的人口数据信息,而其本身就是一种大数据。另外如国家电网的民用电开户数量、活跃用户数量、商业用电户数量,水务和燃气公司的用户信息,交通部门的旅客流动信息,高速公路的通行信息等都能成为有效的人口信息,对人口存量和迁移流动的估算具有很高价值,从而有助于人口统计和数据评估。
四、大数据技术在人普中的应用展望
随着技术的不断发展,以下几种手段或许会被采用。
1.身份证芯片或手机的定位功能
当身份证的内置芯片,开启了更多的功能,如加载个人信息、实时定位、轨迹追踪等,再结合其有效期进行使用(有效期至即芯片失效),那么人口普查将变得更为简单,而人口管理也将更为有效。当然,相应的风险依然存在且会更加严峻。
2.人口普查的智能化
随着对人口普查不配合个人惩罚有效性的增强,以及社会信用体系的建设完善,通过智能手段将应用于此次人口普查。公民通过智能手机通过微信小程序,在规定时间内按要求填报人口信息,将成为此次人口普查的主要方式。对于有效完成人口数据填报的家庭或个人,将给予一定的货币补偿或其他报酬;对于优质填报人员,可以通过抽奖等方式,给予一定的奖励;对于未填报人员,将依据相关法规,给予适当的惩罚。在智能化的前提下,人口普查的成本将大大缩小,每年进行人口普查将成为可能,人口数据的可获得性和准确性将得到极大提升,但这也必然以大数据技术对于各类信息的整合为前提。
作者简介:李严(1976.6—),性别:男,籍贯:山东微山,本科,中级统计师,研究方向:人口调查,城镇化率,各类普查。