大数据背景下预测型警务的构建

闫铁鑫?
内容摘要:当前犯罪出现了多元化、虚拟化、组织化的趋势,基于因果思维的传统侦查模式在应对犯罪异化问题时陷入了困境。数据时代的来临在带来数据分析技术的同时,也带来了大数据思维和大数据分析方法,这为摆脱侦查工作的现实困境提供了一个有利的契机。
关键词:大数据;预测警务;大数据分析方法
一、传统侦查模式亟待转型
近年来,随着数据革命的深入发展,人们的生产、生活方式正在经历着深刻的变化,人类社会的数据种类和数据总量正在以前所未有的速度进行增长,大数据时代的到来引发了传统社会的剧烈变革,与此同时也为公安侦查工作带来了新的机遇与挑战。由于互联网络的蓬勃发展,当前犯罪出现了多元化、虚拟化、组织化的发展态势,基于因果关系的传统侦查模式在应对犯罪异化问题时陷入了困境,传统侦查模式亟待转型。
(一)犯罪形势及犯罪形式的巨变
正如一枚硬币有两面一样,我们在享受大数据带来的巨大便利与财富的同时,我们必然也要承担其所带来的风险和麻烦。在犯罪领域这种风险和麻烦具体化的结果就是产生了一系列的犯罪新形势、新变化。首先,犯罪由传统走向多元。与传统犯罪相比,计算机网络犯罪手段复杂多样,既有利用网络实施的传统犯罪,如网络盗窃、网络传销等;也有利用网络非法攻击计算机信息系统的犯罪,如利用网络侵入计算机系统攻击银行账户、非法获取个人信息等。在大数据时代,移动支付、互联网金融、手机定位、后台轨迹追踪等融入到我们生活中的“衣、食、住、行、消、乐”各个方面,使得这种非传统安全威胁走向多元。其次,犯罪由现实走向虚拟。大数据时代,犯罪活力与再生力明显增强,依托于互联网产生的网络新型犯罪,如网络赌博、网络传销、电信网络诈骗等犯罪层出不穷。据某研究机构统计,我国电信网络诈骗近年来一直保持着高速增长的态势,在2015年曾达到了30%的速度。究其原因,是虚拟空间的隐蔽性和低投入高产出的外在驱动力综合作用产生的结果。网络虚拟空间称为犯罪行为的庇护所,使得犯罪过程暴露的风险大大降低,高增长也就成为必然了。最后,犯罪由个体走向组织。数据时代的来临使得信息传播更加快捷,给我们带来方便的同时也使得犯罪组织策划犯罪更为便利。网络犯罪日趋组织化、集团化,特别是网络赌博、电信网络诈骗中,犯罪分子通过网络信息交流,分工协作,各司其职,形成了严密的犯罪组织。传统侦查模式基于其被动性的特点,不能积极主动适应这种犯罪异化趋势,使得侦查成本随之高涨,侦查效应却相应走低。 除此之外,计算机网络犯罪类型也在不断变化。网络恶意攻击、网络色情、网络制假贩假等犯罪日益频发;网络敲诈勒索、网络恐怖主义、网络制毒贩毒等犯罪持续上升。
(二)信息化侦查遭遇瓶颈
信息化侦查是伴随着信息化技术的发展而产生的侦查模式。与传统的人证、物证等现实空间的侦查方式相比,信息化侦查的侧重点在于强调信息化技术对侦查方式带来的影响与变革。 但是,随着时间的推移、犯罪形势的改变,信息化侦查慢慢地已经不能满足现今侦查工作的需要。首先,从数据角度而言,数据并未得到规模化的应用。信息化侦查中所用的数据大多来源于公安机关日常工作中采集的数据和银行、运输、民航等行业的数据。这些数据大多为结构化数据,且只能反应特定类型的社会生活或特定个人社会活动的某一方面。对于其他类型的社会活动、各类社会成员的日常行为数据,如社交媒体上的信息数据、非结构化数据等并未得到有效的应用。另外,各地方、各警种、各部门的数据库尚处于封闭独立状态,并未形成一個统一的数据处理中心,这在一定程度上妨碍了数据更加有效地运用。其次,从思维的角度而言,信息化侦查所依靠的因果思维对公安信息情报的搜集也产生了一定的阻碍作用。本质上讲,侦查活动就是一个回溯性的过程,是对犯罪行为及其过程的重新建构。传统侦查模式是由犯罪结果回溯犯罪原因的,逻辑上是因果关系,二者之间需要较为紧密直接的联系。基于因果律而设计产生的传统侦查模式就决定了其在搜集情报的时候视野不够开阔,思维不够发散,对信息不够敏感。处于信息时代和情报主导警务的背景下,在情报搜集方面的延迟反馈将会大大阻碍侦查工作的顺利进行。最后,从分析方法而言,传统的信息化侦查并不重视对于所收集到的信息的分析研判,而只是强调对电子信息的获取,并加以简单的信息查询和检索的方法,这并不能发挥出数据应有的价值。
二、大数据的优势
(一)大数据思维
从功能角度上来看,大数据思维分为四个方面——整体思维、容错思维、相关思维和预测思维。首先,整体思维是指数据时代的来临使得人类完全有能力有条件去获得某个或某些研究对象的全部数据,达到“样本=总体”的程度。 拥有研究对象的全部或几乎全部的数据,就能从不同的角度更加细致地观察和考量数据各个方面的细节。基于这种数据的齐全性,对大数据的分析挖掘也冲破了传统抽样分析的束缚,进而发展成为一种全样本分析。其次,容错思维是指当拥有海量数据时,绝对的精准不再是追求的主要目标,在微观层面上对精准性作出一定的让步,容许存一定程度的误差和混杂,反而可以在宏观层面上获取更多有价值的信息。另外,诞生于小数据时代的人类一直信仰并遵循着因果关系的思维模式,强调总是先有原因,后有结果,事物与事物之间总是存在着引起与被引起的因果关系,而相关思维的出现改变了人类长久以来奉为圭臬的因果思维。相关思维是利用大数据分析技术挖掘出事物之间隐蔽的相关关系,获得更多的知识和见解的一种思维方式。最后,预测思维是通过事物与事物之间相关关系的分析来实现的,通过观察理想关联物的变化来发现其关联事物的现实状态或发展规律,并将之用于未来时空便可在一定程度上实现对特定领域的预测。例如百度公司开发的旅游景点预测软件,其预测准确度能够达到百分之九十,背后的原理就在于大多数人在旅游前都习惯在网上搜索旅游地的信息,搜索行为数据越多,实际旅游人数就越多,这之间包含着某种相关性,大数据分析技术可以根据搜索行为数据来预测实际旅游人数,而且这个预测数据与旅游局公布的数值相差无几。
(二)大数据分析技术
数据量在进行爆发式增长的同时,也推动着数据分析技术的革新。人类从依靠自身主观经验作出决定判断转变到依靠数据作出决定判断的关键在于大数据分析技术的革新。本质上讲,大数据不仅仅是一种数据资源,更为重要的是它也是一种分析技术。美国著名的麦肯锡公司的一份报告认为,大数据分析技术是对数据存储、统计分析、数据挖掘、人工智能、时空数据分析、自然语言处理等技术的综合运用。 首先,于大数据而言,对数据的深度挖掘才是重中之重。数据挖掘是指从大量数据中挖掘或提取出未知的、有价值的规律或模式等知识的复杂过程。常见的数据挖掘方法包括聚类分析、分类分析、序列分析、预测分析和回归分析等。其次,自然语言处理亦是一种常用的大数据分析技术。基于语言学和计算机科学的结合的它,是利用计算机算法对人类自然语言进行分析的技术。该技术领域典型的应用就是基于社交媒体对语言的情感进行分析感知,除此之外还包括文本分类、信息过滤、机器翻译等。另外,机器学习在大数据环境下也采用了全新的学习算法实现深度机器学习。实际上,深度学习是对人工神经网络发展的结果,其本质是基于海量数据,通过构建具有许多隐层的机器学习模型来学习更多有用的特征,进而提升分类或预测的准确度。 在这个领域,谷歌、微软、百度等公司走在世界最前沿。其中以谷歌公司研发的AlphaGo项目最为出名,它是第一个击败人类职业围棋选手且同时是第一个战胜围棋世界冠军的人工智能程序。
(三)大数据分析方法
以大数据的世界观来看,世间万物皆可量化,整个世界就如同一个数据化的世界。随着大数据技术的发展,在过去难以量化的领域,如人类的行为、思想,现在亦可用数据来进行刻画。但是,如何将大数据和大数据技术二者进行有机融合、实现从大数据中提取出有价值的情报并辅助于决策这就需要用到大数据分析方法。大数据分析方法是指对增长快速、海量多样、内容真实的数据进行挖掘分析,从中发现可以帮助决策的相关关系、隐藏模式以及其他有价值的信息的过程。 到目前为止,学界还未形成公认的大数据分析方法分类体系,甚至对于其包含哪些方法,也有不同的观点。在此将大数据分析方法分为统计、挖掘、发现、预测和集成五个层次,并将不同种的大数据分析方法归纳到这五个层次之中。统计是指对数据整体的概括理解,可通过例如海量数据的基本统计方法找到信息背后所隐藏的历史活动规律。挖掘是指提取有价值数据,可通过例如文本挖掘、机器学习等手段构建并验证数据之间存在的相关性,发现并归纳其规律性。发现是指从信息中发现新知识,可通过例如神经网络、语义理解等方式鉴别知识、推理知识。预测是指从历史数据中建立对未来发展的假设,可通过例如时间序列分析、多元统计分析等方法进行对事件发展趋势的预测和对现有决策方案的评估。集成是指联系不同属性的要素、使其成为一个有机整体,可通过例如社会网络分析、数据分析等方法实现不同属性元素之间的连接、融合。
三、大数据驱动预测警务的构建
在传统侦查模式下由于犯罪时空的不可逆转性,侦查人员无法在犯罪发生之前就预知并阻止其发生,所以只能在犯罪行为发生之后才采取侦查措施。而数据驱动的预测警务,不再和传统侦查模式下回溯型侦查一样只能在犯罪发生之后才介入进而重构犯罪事实,而是大大提前侦查行为的介入时间,使侦查行为时间同步于甚至先于犯罪时间。这样,侦查行为便不仅仅针对已经发生的犯罪,还指向那些尚未发生或者正在发生的犯罪。犯罪预测并非是新鲜事物,但是过去的犯罪预测主要是依靠人们的主观经验和简单的数据统计所完成的。但大数据、大数据分析技术和大数据分析方法的产生,有望改变传统侦查的时空滞后性的缺陷。大数据的预测功能不仅可以运用在商业领域,同样也适用于侦查领域。通过运用大数据挖掘技术研究分析大量已发生的案件数据,我们可以寻找犯罪因素之间的关联性,总结各类犯罪活动规律;通过研究各类犯罪活动规律,我们便可以预知犯罪地点、作案人员、犯罪时间、作案手段等方面的趋势,准确的预测为侦查工作的前期布置提供了有利条件。我们可以及时发现可疑人员、识别犯罪风险,进而优化警力配置,采取有针对性的措施。现在,大数据驱动的预测型侦查已经被越来越多的国家认可,而且越来越多的部门开始去将大数据技术人融入至侦查实务中去。例如洛杉矶警局根据大数据分析软件描绘的犯罪热点地图,分别将辖区内的盗窃犯罪、暴力犯罪、财产类犯罪案件数量减少了33%、21%、12%。
(一)培养大数据思维,提高警务决策能力
思想指引行动的方向,思维指导行动的方式。对身处于大数据时代的侦查机关而言,培养大数据思维是提高警务决策能力的必然要求。首先,傳统侦查是按照因果关系和数据结构的标准来采集和分析数据,且认定犯罪事实必须要求证据与事实之间存在着引起与被引起的因果关系。 而大数据相关性思维的出现颠覆了人类长久以来的因果思维,更加强调事物之间的相关关系。与强调顺序性的因果关系所不同,相关关系更加看重事物之间的关联性。于公安机关而言,它提供了一种能够在更多的线索之间关联、碰撞出侦破案件火花的逻辑关系。将大数据的相关性思维应用于侦查实务中,可以大大拓展侦查视野,发现更多的线索和情报,这也改善了传统侦查模式对情报信息不敏感的缺点。此外,研究表明数据总和比部分数据更有价值,而且多个数据集的总和重组时,重组组合本身的价值也要比单个总和更大。大数据整体性思维为公安机关开辟了一个全新认识世界的视角。以数据角度而言,世界就是一个承载海量信息的资源库,在这个资源库中,侦查机关有能力找到研究对象的海量数据,使其不断地接触、碰撞、催化重排,挖掘出更深层次的信息为侦查机关所用。数据虽然表示的是过去,但其实表达的是未来。大数据预测性思维更加强调聆听数据自己的声音,让数据说话。传统的侦查中,侦查人员只能凭借过往经验、办案直觉等来应对和办理已经发生的案件,但现在历史数据便可以告诉公安机关哪个地区、哪个时间段发案的可能性较大,这样公安机关便可以事先谋划提前布置警力,最大限度的预防犯罪的发生。按照大数据的思维方式,我们应该以数据化整体论的眼光认识和分析问题,利用相关性分析方法来研究来源不同、海量多样的数据,进而对未来事物的发展趋势做出一定的预测。
(二)开发数据分析技术,促进信息有效利用
如果没有大数据分析技术,那浩如烟海的数据就会如同一座坟墓一般毫无生气,死气沉沉。正是大数据分析技术的存在盘活了这些沉睡的数据,挖掘出这些数据背后的巨大价值。大数据分析技术在警务中的应用主要体现在对已经发生的犯罪精准打击,对当前热点犯罪的精准预防以及对未来犯罪趋势的精准预测等方面。在实践中,越来越多的侦查机关在侦查中采用数据搜索、数据碰撞、数据画像、数据挖掘、犯罪热点分析、犯罪网络关系分析以及与大数据公司合作等方式,帮助他们发现线索,争取侦查的主动权。 例如2013年北京市怀柔区公安局研发的“犯罪数据分析和趋势预测系统”将犯罪地理空间与时间特征相结合,基于其管辖区域近十年的犯罪数据,借助大数据犯罪热点分析系统,使该区域的发案率、报案率、接警率等大幅度下降,并且还为2014年亚太经合组织领导人非正式会议的顺利召开提供了有效的安全保障。对于已经积累多年的警务数据,侦查机关可以通过建立新的模型的分析方法,实现存储数据的多次利用,为犯罪热点、规律分析和趋势预测提供基础。对于互联网随时产生的非结构化数据,特别是文本、图像、视频甚至地理位置信息,要不断创新算法和技术手段,实现对于这些数据实时化、可视化、智能化分析。但是,侦查机关现在能运用的大数据还仅仅是冰山一角,如何能更大程度的深挖其潜在能量发挥出它的真实价值,还有赖于数据分析技术不断发展、部门之间相互协作等问题,这也是侦查机关在未来需要努力的方向之一。
(三)创新数据分析方法,实现多源情报融合
实现对于未来事件发展趋势的精准预测有赖于前期情报工作的铺垫和历史数据的积累。究其本质而言,大数据时代就是一个数据分析的时代。从功能角度上来讲,大数据分析方法实现了从数据到情报的转换,其在情报领域内有着非常广阔的应用前景,适用于情报的搜集、融合、发送、共享等诸多情报处理环节。例如,著名的数据库开发公司Objectivity所开发的InfiniteGraph和Objectivity/DB两款数据分析工具是比较典型的可适用于情报领域的工具。从本质上讲,大数据分析方法應用于多源情报融合的主要任务是通过对海量、来源不同、类型众多的数据(如文本、图像、语音、视频等)进行相关关联,将其转化为所需的各类专用情报,这为从事于情报工作的侦查机关提供了有力的支持。在情报分析的过程中,仅仅分析来自单个节点的情报并不足以支持决策,还需要对各个节点之间的关系进行全面的分析研究。因此,关系分析也是大数据分析方法在情报领域内的应用之一。但这仅仅还是一部分方法,大数据分析方法也需要随大数据分析技术的发展不断创新,这就需要有关人员以新颖的、富有想象力的方式研究数据、分析数据,需要不断的去探索、试验、评价和反馈,将其与情报工作进行有机的融合,为大数据驱动的预测警务工作提供强有力的支撑。