标题 | 疫情防控背景下基于无线日志的 区域人数统计与接触追踪方法 |
范文 | 安洋 李军怀 王怀军 摘? ?要:目前疫情防控依旧处于关键阶段,如何有效做好高校复学复课和疫情防控工作成为国家和教育工作者重点关注的问题。随着高校校园网络基础设施的持续升级完善,通过无线接入点(Access Point,AP)日志信息进行学生位置及轨迹分析成为可能。文章提出了一种基于无线日志的校园区域人数统计与接触追踪方法,该方法通过对无线AP日志信息的采集与分析,实现对学生位置信息的无感知获取,动态可视化呈现高校日常教育教学中学生的位置分布、楼宇等区域的人流密度、学生在校的行为轨迹等,为高校复学后的疫情防控提供有效支持。 关键词:疫情防控;无线日志;无感知定位;接触追踪 中图分类号:G434 文献标志码:A 文章编号:1673-8454(2021)01-0075-04 一、引言 随着移动网络的迅速普及,以智能手機为代表的移动设备在日常生活中随处可见。通过对移动智能设备相关的用户行为数据进行无感知采集和分析,能够为疫情防控中区域人数统计与人员接触追踪提供帮助。随着高校信息化水平的不断提高,以及基础网络设施的持续升级和完善,校园无线网络几乎达到了教学区与生活区的全覆盖,校园网络逐渐成为高校学生生活中不可或缺的重要组成部分,与学生的学习、工作和生活紧密相连。鉴于校园网络连接的便携性、灵活性、无感知认证等特性,加之网络日志信息的快速增长,通过对如此海量的日志信息进行挖掘、关联分析,能够发现大量有价值的用户行为信息,为学生提供更多智能化的服务。 对于校园无线网络而言,无处不在的WiFi设备,大量密集的AP设备部署于其中,移动设备的每一次AP接入、上线、下线均会在网络设备上有所记录[1]。无线AP具有区域有效的特性,对于分布于该区域内的移动设备无线上网提供服务,当用户从当前区域移动到另外一个区域时,会发生AP切换,因而根据AP日志记录结合AP位置分布可以实现用户位置信息的获取及移动轨迹的查询。同时,两个用户在距离相近的区域持续一段时间,该区域的无线AP中会记录该区域范围内的用户设备MAC地址。 基于无线网络接入的上述特点,在疫情防控背景下,通过对校园无线上网日志进行分析和挖掘,可以实现学生分布热力图、人流密度分析与预警、轨迹追踪、特殊人群行为预警、建筑物楼层人数分析、校园区域实时人数统计等应用功能,为疫情防控背景下高校复学复课后,校园环境中的区域人数统计和特殊情况下的接触追踪提供服务。 二、相关研究 目前,针对人数统计的方法大致分为三种:基于计算机视觉的人数统计方法、基于可穿戴设备的人数统计方法和基于WiFi的人数统计方法。基于计算机视觉的人数统计方法采用摄像设备收集场景中的图像或图像序列,然后使用图像或视频处理相关技术实现目标的人体检测和人数识别。该方法由于在设备、方法、用户隐私、光线条件等方面的局限性使得其难以在人数统计系统中广泛应用。基于可穿戴设备的人数统计方法通过监测者佩戴内置有传感器的设备进行人数识别与统计,该方法需要被监测对象必须佩戴特定设备才行,在舒适性与便携性等方面存在一定的局限。与前两种方法不同,基于WiFi的人数统计方法更能实现无感知的被动识别,不受特定场景和时间的限制,低成本,实现简单,更适合推广应用。 在无感知人数统计方法的研究中,郭玉彬等人[2]针对某高校无线网络日志数据进行分析挖掘,首先对校园内各建筑物的无线网络连接人次进行统计,其次采用R-树索引,结合密度聚类算法得到校园区域划分,最后实现人群聚集点分布和区域之间人群移动规律的获取。该方法有效地解决了中心经纬坐标动态变化的问题,可长期、持续对校园网日志数据进行处理而不受校园网扩建和AP不稳定的影响,但识别粒度仅限于校园区域或楼宇,并未细分到具体楼层和教室,在室内识别方面涉及较少。丁亚三等人[3]提出了一种基于WiFi-CSI的室内人数识别方法WiCount,该方案通过信道状态信息的幅值波动来描述室内人数的变化,并结合机器学习算法实现对人的计数。该方法虽然在一定程度上提高了室内人数识别方法的性能,但其识别人数仅能保持在4人以下,无法适用于较大规模的室内人数识别,且需要经历线下的模型训练过程,无法保障识别的实时性。Manpreet等人[4]提出了一种基于WiFi日志信息的用户购物意图识别和位置预测方法,该方法将物理空间通过销售物品类别进行语义化标识,然后进一步分析用户行为和位置预测在网络搜索内容与物理空间上下文之间的相似度,以更好地发现有消费意向的用户。Traunmueller等人[5]通过WiFi探测器和位置数据对城市居民的移动轨迹进行分析。Ciftler等人[6]通过WiFi探测器接收到的连接请求对楼宇内的居住率进行统计。 与之前的研究相比,本文通过对校园广泛部署的无线接入点日志信息进行分析,能够无感知实现校园区域室内和室外的用户定位与人数统计,且统计粒度更为精细,可具体到楼宇内的楼层、办公室、教室或宿舍,从而更易被广泛应用于校园的安全、管理、疫情防控等工作中。 三、基于无线日志的区域人数统计与接触追踪方法 基于无线日志的区域人数统计与接触追踪方法整体框架如图1所示。首先对无线上网日志、用户基本信息、用户设备MAC地址与学工号对应关系、无线AP与部署位置对应关系等数据通过相关技术进行采集;其次对无效数据、缺失数据、数据不一致等问题数据进行剔除、补全与标准化等预处理操作;接着根据关键字信息进行日志分类,针对每种类别的日志数据选择合适的解析规则进行关键信息提取,结合用户基本信息等辅助数据进行信息聚合分析,建立用户定位模型;基于用户定位模型,进一步实现位置分布、人数统计、轨迹查询和接触追踪等功能;最后结合可视化建模技术进行应用呈现,实现区域人数统计与用户轨迹查询,并在特殊情况下快速完成接触追踪,为高校复学后的疫情防控工作提供技术支持。 1.基于无线AP的人员定位原理 在校园无线网络覆盖区域,用户的移动智能设备会通过发送周期性的探测请求来扫描并收集环境中可用的无线通信信道。每一个无线AP都由一个唯一MAC地址进行标识,当无线AP接收到移动设备的探测请求后会予以回应,无论是否加密,是否已连接,甚至信号强度不足以显示在设备的无线信号列表中,移动设备都可以获取到该AP广播出来的MAC地址。接着,移动智能终端选定确定连接的SSID并向其发送验证信息,无线AP对验证信息进行响应认证。最后,移动智能终端向该无线AP发送连接请求,无线AP响应连接请求并将该设备接入互联网[1]。如图2所示。 在此过程中,根据IEEE对无线WiFi标准(即802.11协议)的定义可知,当移动智能设备在访问互联网时,如果有多个AP具有相同的SSID,则移动设备会选择信号最强的AP进行连接,即距离自己最近的无线AP。基于此,通过用户上网所连接的无线AP部署位置信息便可以获知用户当前所在位置,从而进行区域人数统计与轨迹查询。对无线日志进行分析,获取到用户设备与无线AP的连接状态,结合无线AP在校园的物理部署位置以及用户信息与MAC地址对应关系表,即可实现用户定位,最后通过可视化工具进行显示,直观地描述个人在校园的行为轨迹。 2.区域人员定位与人数统计方法 基于无线日志信息进行区域人员定位、人数统计、轨迹查询及接触追踪等应用分析时,需要将无线接入日志与用户信息、AP位置信息进行关联,才能获得有效的用户及具体位置信息,其中的关联关系如图3所示。 为了实现本文的功能设计,在此过程中需要三张辅助数据表进行联合分析,分别为用户基本信息表、用户设备MAC地址与学工号对应关系表、无线AP与部署位置对应关系表。数据采集阶段主要对以上内容进行采集,针对不同的数据源,采集方式各不相同。 本文主要通过Flume技术、ETL技术和数据导入三种方式进行原始数据采集。首先,基于Flume技术实现实时流日志数据采集,采用Kafka进行实时流调度处理,通过实时流数据聚合技术,结合Spark Stream完成实时流计算功能,实现对日志数据的实时计算与分析处理。通过ETL技术采集用户基本信息、用户设备MAC地址与学工号之间的关系对应表。采用Excel导入形式获取最新的无线AP位置分布信息。 将数据采集阶段获取的数据进行清洗转换,删除无效数据,制定日志解析规则。同时,将采集到的数据信息规范化,保持格式统一。在无线AP日志数据中,每一行代表一条日志数据,其中记录着用户移动设备的MAC地址、IP地址、上下线时间、当前连接无线AP的名称和设备连接状态等信息。从AP管理端AC(Access Controller,接入控制器)上获取的日志数据包含AP配置、AP上下线、用户连接等多种类别日志信息,因此,本文主要对涉及用户位置获取的五类日志进行处理,如表1所示。 由于日志所属的类别不同,因此每条日志数据的格式也并不固定。首先需要通过关键字进行日志类别筛选,将对应的日志信息划分到正确的分组队列,接着通过每个类别日志特定的正则表达式进行日志解析,提取核心关键信息。 本文方法将校园划分为若干个子区域,如操场、教学1号楼、1号餐厅等。对于某一特定子区域而言,可以通过对子区域范围内AP设备的移动终端连接量进行分析来实现人数统计。移动终端以MAC地址作为唯一标识,因此某区域的人数计算如公式1所示: S=∑f(MAC)(1) 其中,S表示当前区域总人数,f(MAC)表示区域内移动设备的MAC地址。 由于某一区域内用户可能会多次连接区域内不同或相同的AP设备,因此在人数统计时需要进行去重处理,保证统计过程中一个MAC地址只被计算一次。同时,对于区域边界范围可能会出现的路过连接现象,即用户处于该区域以外,但在某种情况下,短暂连接到该区域的AP设备,使得AP日志中会包含此部分噪音的MAC地址,因此在人数统计时,通过设定连接持续时间(如10分钟),排除此种噪音数据。考虑到以上两点,本文在人数统计过程中采用公式2进行区域内有效MAC地址计算: f(MAC)=总MAC地址-重复MAC地址-噪音MAC地址(2) 学生在校行为轨迹特征主要由活动时间和活动空间两部分构成。本文基于上述日志处理结果,结合校园区域功能划分,分析学生行为轨迹的时空特征。假设U={u1,u2,…,un}表示用户集合,L={l1,l2,…,lm}表示校园区域集合,T={t1,t2,…,tk}表示时间集合,则某一用户ui随着时间推移的行为轨迹Pi如公式3所示: Pi={(ui1,li1,ti1),(ui2,li2,ti2),(ui3,li3,ti3),……}(3) 本文采用窗口大小H對时间进行窗口划分,如半小时为一个时间窗口,则会得到固定时间间隔的用户位置信息w=(l,t),一系列用户位置信息组成的序列可以作为用户轨迹特征来描述用户行为轨迹移动,如公式4所示: Pi={ui,w1,w2,w3,……}(4) 基于上述用户行为轨迹描述,可以进一步实现用户轨迹查询、接触追踪等具体应用。 四、实验分析 本文的实验数据来自某高校无线网络设备日志,校园无线AP总数为1480个,实验部分采集了2020年4月份无线网络日志数据作为样本数据。原始样本数据共3GB,经过分析与处理后的有效数据为238366条。 基于本文提出的方法,设计开发了区域人数统计与接触追踪系统,如图4所示。该系统首先展示了校园区域的人数信息,通过下钻可以获取楼宇等区域内部每层甚至每间教室的人数及人员列表信息;其次,通过设置起止时间,可以查询某段时间内用户的校园活动轨迹;最后,可以实现特殊情况下的接触追踪查询,快速准确地获取亲密接触人员列表信息,无需再依赖用户的记忆,以及繁琐的方式来获取接触人员信息,从而有效精准地记录用户的接触行踪。 五、结语 随着无线传感技术的快速发展,以非接触式、被动感知和便于部署等特点而广泛受到关注的WiFi感知技术成为校园位置预测与人数统计领域的研究热点。本文提出利用移动智能设备结合无线上网日志信息进行人员位置及轨迹追踪,为有效抗击疫情提供了信息化手段的支持。 参考文献: [1]赖特.无线WiFi接入点欺骗及其检测技术研究[J].信息与电脑(理论版),2020,32(3):154-156. [2]郭玉彬,吴宇航,周哲帆等.基于密度聚类算法的校园人群聚集和移动规律分析[J].计算机应用研究,2020,37(3):688-692. [3]丁亚三,郭斌,辛通等.WiCount:一种基于WiFi-CSI的人数识别方法[J].计算机科学,2019,46(11):297-303. [4]Manpreet Kaur, Flora D. Salim, Yongli Ren, Jeffrey Chan, Martin Tomko, and Mark Sanderson. Shopping intent recognition and location prediction from cyber-physical activities via wi-fi logs[C].Proceedings of the 5th Conference on Systems for Built Environments. New York, USA: Association for Computing Machinery,2018:130-139. [5]Traunmueller M, Johnson N E, Malik A, et al. Digital footprints: Using WiFi probe and locational data to analyze human mobility trajectories in cities[J].Computers, Environment and Urban Systems,2018:4-12. [6]Ciftler B S, Dikmese S, Guvenc I, et al. Occupancy Counting With Burst and Intermittent Signals in Smart Buildings[J].IEEE Internet of Things Journal, 2018,5(2):724-735. (編辑:王晓明) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。