深度神经网络在城市交通预测中的应用
龙望晨 王索 罗定福 刘红
摘要:深度神经网络能够有效地捕捉城市区域间的时间和空间相关性,同时对于特征工程依赖较少,逐渐成为交通预测中的应用热点。首先介绍交通预测的主要内容和挑战,从捕捉时空相关性的角度归纳近年来比较流行的基于深度神经网络的交通预测方法,分析各类方法的优缺点,最后对深度神经网络在交通预测中的未来发展前景进行展望。
关键词:机器学习;深度神经网络;交通预测
中图分类号:TP311? ? ? 文献标识码:A
文章编号:1009-3044(2021)16-0183-03
开放科学(资源服务)标识码(OSID):
Application of Deep Neural Network in Urban Traffic Prediction
LONG Wang-chen , WANG Suo ,? LUO Ding-fu ,? LIU Hong
(School of Computer and Information Engineering, Guangdong Songshan Polytechnic College, Shaoguan 512126, China)
Abstract: Deep neural network can effectively capture the temporal and spatial correlation between urban regions, and at the same time, it is less dependent on feature engineering, which gradually becomes the application hotspot in traffic prediction. Firstly, it introduces the main contents and challenges of traffic prediction, summarizes the popular traffic prediction methods based on deep neural network in recent years from the perspective of capturing temporal and spatial correlation, analyzes the advantages and disadvantages of various methods, and finally forecasts the future development prospect of deep neural network in traffic prediction.
Key words: machine learning; deep neural network; traffic prediction
1 引言
隨着国民经济的高速发展和城市化进程的不断深入,城市机动车数量急剧增加。交通堵塞及车辆事故经常发生,城市机动车保有量的迅猛增长与有限的城市空间和道路资源之间的矛盾日益加剧,已成为影响和制约我国城市交通系统良性发展的关键因素。城市交通预测是解决这一矛盾的有效手段,城市交通预测通过研究历史交通时空序列数据,尝试构建城市交通的动态演化规律,以实现预测未来交通状况。交通预测主要可以分为以下几类:
1)流量预测:预测一个或多个节点或路段在某个时刻的通过车辆的数量;
2)速度预测:预测一个或多个节点或路段所有车辆的平均通过车速;
3)需求预测:预测一个或多个区域在某个时刻的用车需求;
4)出行时间预测:预测从某个地点前往另一地点所需的出行时间。
交通预测会面临以下挑战:
1.1复杂的空间相关性
交通流的变化受区域间相互影响,产生影响的条件主要有以下几点:
1)物理距离邻近。由地理学第一定律可知:空间距离越近的区域,其关联程度越强[1]。所以,某个区域的交通状态是受其邻接区域直接影响。如图1中,区域A与其相邻的区域C之间存在较强的影响。
2)具有高速道路连接。如图1中,区域B与区域C之间有着高速道路直接相连,车流能够快速地在区域B和区域C相互传导,最终使得这两个区域之间的交通状况非常相似。
3)具有相似的功能性。某些距离上较远,但具有相似功能性的区域间也存在着比较强的关联性。例如图1中,区域B与区域C都有学校,学生出入校园的时候区域B和区域C的交通状况很相似。
1.2动态的时间相关性
区域间的相互影响随着时间而不断变化,主要表现为以下特点:
1)时间越近,影响越大。一般来说,当前时间交通状态与最近的历史交通状态有着密切的关系。
2)周期性相关性。城市交通状态往往呈现出周期性,例如:工作日时间,每天上午8点的交通状态是类似的,每个周末的交通状态也很可能是相似的。区域的当前状态与上一个周期的同一时刻相似。
1.3外部因素
城市交通受很多外部因素如:天气、节假日等影响。一场暴雨导致整个城市的交通的瘫痪;突然的冷空气降温可能只是推迟了上班高峰期的出现。不同的外部因素对城市交通的影响也是不同的。
上述的这些复杂的因素共同作用在一起,对城市交通状态产生的不可预知的影响,使得城市交通的预测变得非常具有挑战。
2 深度神经网络在交通预测中的应用
深度神经网络通过构造深层的非线性网络结构在计算机视觉、自然语言处理、医疗影像等众多领域取得了令人瞩目的成绩[2]。得益于深度学习技术的突破,深度神经网络在表达复杂的时空相关性方面表面出很强的能力。而城市交通预测的关键是捕获城市区域间时空关系的动态变化规律,因此,越来越多的研究者尝试将深度神经网络应用于交通预测中。基于城市交通的历史时序数据,利用深度神经网络去学习其中的时空相关性变化规律是实现准确预测的关键。为了实现精准的交通预测,现有基于深度神经网络的预测方法会针对不同的预测场景,通过组合不同的深度神经网络来联合学习时间相关性和空间相关性。本文将从空间相关性建模和时间相关性建模的角度对已有基于深度神经网络的预测方法进行介绍。
2.1 空间相关性建模
城市的区域位置可以通过二维坐标关系进行表达,因此城市空间的相关性形成了一个对应的二维空间相关图。空间相关性建模的目的在于捕捉所有区域间的空间特征。
2.1.1 基于卷积神经网络(Convolutional Neural Networks)
卷积神经网络因具有较强的捕捉二维空间特征而出名[3]。卷积神经网络利用不同的卷积核对二维空间特征进行压缩,然后再利用全连接网络进行映射输出,它能够学到大量的映射关系而不需要任何输入和输出之间的精确数学表达式。卷积本质上就是利用一个共享参数的过滤器(kernel),通过计算中心像素点以及相邻像素点的加权和来构成特征图并实现空间特征的提取。为了能够让卷积进行有效的应用,一般需要将二维交通图进行网格划分。如图2所示,将整个城市使用网格进行划分,每个网格代表一个区域,所有网格进行整齐排列,形成欧式数据结构(Euclidean Structure)。卷积操作能够非常高效的在这样的结构中捕捉到空间特征。文献[4-7]都采用了卷积神经网络,这些方法首先都需要对整个城市进行网络划分,进而构建出欧式数据结构图,然后再利用卷积去学习不同网格区域之间的空间相关性。
2.1.2 基于图卷积神经网络
近几年,有学者提出区域间相互关系形成交互图并不是二维结构的,例如两个相邻区域相关性很强,两个相隔很远的功能相似的区域之间也可能存在很强的相关性。考虑各种关系后,城市不同区域之间的交互关系会形成一个类似图3的非欧式结构图(Non-Euclidean Structure)。而卷积神经网络CNN适合于二维平面图,并不太适合于立体图,所以学者开始将适用于非欧式结构图的方法图卷积神经网络(Graph Convolutional Network)来捕捉空间特征。可以将图卷积神经网络可以分为两类:基于谱域的图卷积神经网络和基于空域的图卷积神经网络。基于谱域的图卷积神经网络利用图上傅里叶变换和卷积定理从谱域定义图卷积,而基于空域的图卷积神经网络则在节点域定义加权函数在聚合中心节点及其邻居节点的特征[8]。这两种方法本质上都是尽可能多的聚合图中节点及其邻居节点之间的空间关系。采用图卷积神经网络捕获空间相关性的代表有文献[9-12],这些方法首先会根据不同的应用构建对应的具有图结构的区域空间相关性图,然后再设计不同的图卷积方式去学习区域间的空间相关性。
2.1.3 基于注意力机制
无论是CNN还是GCN,其核心都是基于卷积操作,卷积操作会有一个特点是对于近距离区域节点关系的捕捉能力强,而对于远距离节点关系的捕捉能力弱。针对CNN和GCN的这一不足,有学者将注意力机制(Attention Mechanism)应用于捕捉空间特征关系。注意力机制本质上是通过构建一个包含全体区域的相关矩阵来表达各个区域间的关系程度,因此注意力机制不仅能够捕捉到近距离节点的关系强弱,也可以有效的表达出远距离节点影响程度。注意力机制能够表达出不同空间区域在不同时刻存在的不同大小的影响关系。采用注意力机制捕获空间相关性的文献有[13-14],这些方法在表达远距离节点影响程度上具有优势,但注意力机制也需要消耗更大的计算量。
2.2 时间相关性建模
在时间维度上,交通流数据是时序数据,具有一些明显的特征:相邻时序相关性,周期相关性等。一个好的方法需要能够建模出交通流数据这些特性,所以在时间维度的研究上主要关注了局部相关性,周期性等特征。
2.2.1 基于循环神经网络
循环神经网络(Recurrent Neural Network)是专门用于处理序列数据的神经网络,它具有记忆历史序列信息的能力,因此很自然就成了捕捉时间相关性的首选算法。但是,研究人员发现当输入的时序数据比较长的时候,循环神经网络存在梯度消失的问题,表现在记不住隔得远的数据,只能记得近期的数据。这个缺点使得它不能有效的关注到交通流数据中的周期性特征。于是,研究人员开始后面人们利用长短期记忆人工神经网络(Long Short Term Memory networks)和门控循环单元(Gated Recurrent Neural Networks)去捕捉区域间的时间相关性。长短期记忆人工神经网络和门控循环单元是循环神经网络的变种,它们在循环神经网络的基础上添加了门机制,其网络结构如图4所示。门机制能够选择性的忘记不重要的历史信息,这样可以网络在保留长期序列信息下减少梯度消失问题。采用长短期记忆人工神经网络和门控循环单元捕获时间相关性的文献有。文献[4,10,11,14,15]分别利用了LSTM或GRU来实现时间相关性的学习,这些方法都是先捕获空间相关性,然后再基于LSTM或GRU再进一步完成时间相关性的学习。
2.2.2 基于自注意力模型
长短期记忆人工神经网络和门控循环单元虽然改善了RNN存在的问题,但效果仍然存在长历史信息丢失的问题。于是研究人员又将注意力机制用于捕捉長期的时间特征,其中以Transformer中的自注意力模型(Self-Attention Mechanism)表现尤为出色[16],它弥补了类RNN模型的记不住长期上下文的缺点同时实现了并行计算。不过,Transformer中的自注意力模型默认是丢失了位置关系,也就是说没有时序的概念。所以,利用自注意力模型在处理时序数据时,需要另外提供时序位置信息才能够有效的捕捉到区域间的时间相关性。文献[13-14]利用注意力机制实现了长距离时间相关性捕捉,但是注意力模型计算复杂度相对较高,对于计算和存储容量需求较大。
2.2.3 基于卷积神经网络
因为交通流数据是时序数据,具有相邻时序相关性,周期相关性等特征。如果把每个时刻分成独立的块,卷积神经网络也是可以捕捉相邻时序块的相关性的。基于卷积神经网络捕获空间相关性的文献有[6,17]。为了捕捉到周期性,卷积神经网络需要能够捕捉长距离间的特征,而单层卷积神经网络是只能捕捉到相邻区域而无法捕捉长距离时间相关性的。所以需要加深网络用多层卷积神经网络通过不断叠加网络深度来形成更大的感受野,进而实现长距离时间相关性的捕捉。但这种方式存在计算效率低,优化困难等缺点。
3 结语
城市交通预测旨在利用历史交通时空序列数据,探寻城市交通的动态演化规律,以实现未来交通状况的预测,在交通规划、安全管理和资源配置等方面起到重要作用。本文介绍了城市交通预测的主要内容及其挑战,从捕获时空相关性的角度阐述了已有基于深度神经网络方法的优缺点。虽然已有基于深度神经网络方法取得了不错的成绩,但大多数方法并不能够实现线上实时预测。此外,现有方法对于交通数据的安全保护还需要进一步提高。
参考文献:
[1] Tobler W R.A computer movie simulating urban growth in the Detroit region[J].Economic Geography,1970,46(sup1):234-240.
[2] LeCun Y,Bengio Y,Hinton G.Deep learning[J].Nature,2015,521(7553):436-444.
[3] 周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251.
[4] 晏臻,于重重,韩璐,等.基于CNN+LSTM的短时交通流量预测方法[J].计算机工程与设计,2019,40(9):2620-2624,2659.
[5] 叶景,李丽娟,唐臻旭.基于CNN-XGBoost的短时交通流预测[J].计算机工程与设计,2020,41(4):1080-1086.
[6] Zhang J B,Zheng Y,Qi D K,et al.DNN-based prediction model for spatio-temporal data[C]//Proceedings of the 24th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems.Burlingame California.NewYork,NY,USA:ACM,2016.
[7] Zhang J B,Zheng Y,Qi D K,et al.Predicting citywide crowd flows using deep spatio-temporal residual networks[J].Artificial Intelligence,2018,259:147-166.
[8] 徐冰冰,岑科廷,黄俊杰,等.图卷积神经网络综述[J].计算机学报,2020,43(5):755-780.
[9] 徐先峰,黄刘洋,龚美.基于卷积神经网络与双向长短时记忆网络组合模型的短时交通流预测[J].工业仪表与自动化装置,2020(1):13-18.
[10] 陈喜群,周凌霄,曹震.基于图卷积网络的路网短时交通流预测研究[J].交通运输系统工程与信息,2020,20(4):49-55.
[11] Yu B,Yin H T,Zhu Z X.Spatio-temporal graph convolutional networks:adeeplearning framework for traffic forecasting[C]//Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence.July13-19,2018.Stockholm,Sweden.California:International Joint Conferences on Artificial IntelligenceOrganization,2018.
[12] Wang X Y,Ma Y,Wang Y Q,et al.Traffic flow prediction via spatial temporal graph neural network[C]//Proceedingsof The Web Conference 2020.Taipei Taiwan.NewYork,NY,USA:ACM,2020.
[13] 杜圣东,李天瑞,杨燕,等.一种基于序列到序列时空注意力学习的交通流预测模型[J].计算机研究与发展,2020,57(8):1715-1728.
[14] Feng J,Li Y,Zhang C,et al.DeepMove:predicting human mobility with attentional recurrent networks[C]//Proceedings of the 2018 World Wide Web Conference on World Wide Web - WWW '18.April10-27,2018.Lyon,France.New York:ACMPress,2018:1459-1468.
[15] 鳳少伟,凤超,申浩.基于K-means与GRU的短时交通流预测研究[J].计算机技术与发展,2020,30(7):125-129.
[16] Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need[C]//Advances in neural information processing systems. 2017: 5998-6008.
[17] Song C,Lin Y F,Guo S N,et al.Spatial-temporal synchronous graph convolutional networks:anew framework for spatial-temporal network data forecasting[J].Proceedings of the AAAI Conference on Artificial Intelligence,2020,34(1):914-921.
【通联编辑:唐一东】