上海理工大学学报  2022, Vol. 44 Issue (6): 592-602   PDF    
联合时空特征的交通流参数预测综述
关为生, 肖建力     
上海理工大学 光电信息与计算机工程学院,上海 200093
摘要: 针对交通流参数预测在智能交通系统中的重要性,为寻求更实时准确的预测方法,对联合时空特征的交通流参数预测方法进行综述。以交通时空数据为研究对象,将交通流参数预测方法归纳为统计学习方法、深度学习方法和图神经网络方法。基于这3类方法分别从传统和联合时空特征角度概括了各种方法的研究现状和特点,分析了交通流参数预测的难点。结果表明,联合时空特征的交通流预测方法由于考虑了道路网络中复杂且动态的时空依赖性,相较于传统的同类方法,预测性能有较大提升。最后,从模型输入和模型设计角度,讨论了交通流参数预测未来研究方向。
关键词: 交通流预测     统计学习     深度学习     图神经网络    
A review on parameters prediction of traffic flow by combining spatio-temporal features
GUAN Weisheng, XIAO Jianli     
School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China
Abstract: Considering the importance of traffic flow parameters prediction in intelligent transportation systems, the traffic flow parameter prediction method combining spatio-temporal features was summarized to find a more accurate real-time prediction method. Taking the traffic spatio-temporal data as the research object, the prediction methods of traffic flow parameters were divided into statistical learning method, deep learning method, and graph neural network method. Based on these three categories methods, the research status and characteristics of various methods were summarized. The difficulties of traffic flow parameters prediction were analyzed from the perspective of traditional and spatio-temporal features. The results show that the traffic flow prediction method combined with spatio-temporal features has a great improvement in prediction performance compared with the traditional similar methods because it considers the complex and dynamic spatio-temporal dependence in the road network. Finally, the future research direction of traffic flow parameters prediction was discussed from the perspective of model input and model design.
Key words: traffic flow prediction     statistical learning     deep learning     graph neural network    

交通流理论是智能交通的重要理论基础,重点研究微观、中观、宏观不同空间和不同时间尺度下路段或路网的交通流状态及运行规律[1],实现这一目的的主要手段是对交通流主要参数进行计算和分析。在交通流理论中,描述交通流特性的参数主要有:交通流量、交通速度和交通密度[2]。交通流量表示在单位时间内通过某一断面或某一车道的交通实体数;交通流速度的定义有多种,最常用的是路段平均速度,它是路段长度和车辆通过该路段平均时间的比值;交通流密度用以描述车辆在空间上的数量分布,它是车辆数和路段长度的比值。交通流参数预测模型通常采用平均绝对误差、平均绝对百分比误差和均方根误差作为评价指标,误差越小,表示模型预测效果越好。

交通流参数对交通流特性的分析至关重要,但是在某些情形下交通流参数却无法直接获得。比如未来时刻的交通流参数无法获得,或者由于检测器数量限制,某些区域无法获得交通流参数。因此,非常有必要对交通流参数进行预测,特别是进行未来交通流参数预测对于城市交通的诱导和控制非常关键,这也是本文探讨的重点。

影响交通流参数预测性能的因素主要是采集的交通数据和构建的预测模型。采集的交通数据主要分为3种类型:二维空间连续的时空栅格数据、道路拓扑结构的时空图数据、用户行为的时空轨迹数据[3]。根据不同数据结构,交通预测的对象和目标也有所不同。时空栅格数据的预测主要基于欧式空间距离完成;时空图数据的预测主要基于道路拓扑结构结合时间序列完成;时空轨迹数据的预测可以基于状态转移矩阵和马尔可夫决策过程完成。交通数据的完整性和质量会对预测性能造成显著影响,因此,在进行交通流参数预测前需要对数据进行评估和处理。

交通流参数预测模型多种多样,常见模型大致可以分为3类:基于统计学习、基于深度学习和基于图神经网络。早期交通流参数预测往往只考虑交通数据的时间特征,而不考虑数据的空间特征[4]。例如,预测某一路段未来交通速度,只考虑该路段本身的历史速度数据。实际上,该路段的交通速度受相邻路段的交通速度影响,为提高预测准确性,构建预测模型时应考虑这一因素。为此,越来越多的研究者开始关注联合时空特征的交通流参数预测方法。

基于上述分析,本文将对联合时空特征的交通流参数预测方法进行详细回顾。为突出研究对象和目标,本文所回顾的文献主要使用时空栅格数据或时空图数据,预测目标为交通流量或交通速度。

1 交通流参数预测中的统计学习方法

首先总结统计学习方法在交通流参数预测中的应用。图1为交通流参数预测中传统统计学习和联合时空特征统计学习的典型方法。如图1左侧所示,传统统计学习方法主要包括自回归平均移动模型、支持向量机、k近邻方法等。如图1右侧所示,将这些传统方法拓展至时空特征层面,得到联合时空特征的改进模型,主要包括时空自回归平均移动模型、时空支持向量机、基于时空信息增强的k近邻模型、改进的k近邻模型,以及自适应时空k近邻模型等。


图 1 交通流参数预测中传统统计学习方法和联合时空特征统计学习方法 Fig. 1 Traffic flow parameter prediction methods based on traditional statistical learning methods and statistical learning methods combining spatial and temporal features
1.1 传统统计学习方法

在交通流参数预测中,早期使用的方法是基于统计学习的时间序列方法。早在20世纪,就有诸多统计学习方法在该领域广泛应用,其中最为常见的有历史平均法[5]和自回归移动平均模型[6]

历史平均法[5]使用历史交通数据的平均值作为预测值。该方法不需要任何假设,计算简单快捷,但较少考虑时间特征,也不考虑空间特征,预测精度较低。

自回归移动平均模型[6]包含3个部分:自回归、差分和移动平均。自回归移动平均模型首先通过差分计算,保证时序数据的稳定性。然后通过自回归和移动平均描述当前值与历史值之间的关系,即用变量自身历史数据对未来进行预测。在过去的十几年中,许多基于自回归移动平均的交通流参数预测模型被提出,如季节性自回归移动平均模型[7]、联合自组织映射自回归移动平均模型[8]和具有自回归移动平均误差传递函数的ARIMAX模型[9]

上述早期统计学习方法有着坚实的数学基础,可以帮助理解预测生成的机制,但在处理复杂和高度非线性的数据时,无法作出准确预测[10]。支持向量回归[11-12]和支持向量机[13]通过核函数将低维非线性数据映射到高维空间,实现对非线性数据的预测。此外,贝叶斯方法[14]k近邻[15]和人工神经网络[16]由于具有非线性数据处理能力,在交通流参数预测中取得不错的效果。

1.2 联合时空特征的统计学习方法

传统统计学习方法往往基于时间特征对交通流参数进行预测,而不考虑空间特征。实际在对路网中多个观测点进行交通流参数预测时,不仅需要考虑待预测点的时间序列信息,还要考虑待预测点在路网中的空间位置信息。因此,Kamarianakis等[17]将传统自回归移动平均模型结合数据采集点的地理位置信息,提出建立时空自回归移动平均模型来预测交通流参数。

基于传统k近邻模型,于滨等[18]通过分析k近邻算法的时间和空间参数,引入时空参数和指数权重,从设置时空状态向量和采用权重距离度量两方面改进传统k近邻算法,其预测效果明显优于只考虑时间特征的预测模型。Wu等[19]同样实现了一个基于时空信息增强的模型,并验证该模型比仅使用时间信息的模型具有更好的性能。

上述研究考虑了附近路段的影响,却无法清楚地量化路段之间的时空相关性。因此,Cai等[20]提出了用等效距离代替路段间的物理距离的改进k近邻模型。由实际路网采集的静态和动态数据定义等效距离,路段交通状态由时间序列描述变为时空状态矩阵描述。再根据高斯加权欧氏距离选择最近邻,调整时空因素对时空状态矩阵的影响,从而提高时空相关的预测精度。

然而,此类时空k近邻仍不能精确地量化时空关系,主要原因在于k近邻建模中,状态空间的空间维数m和时间窗n的大小不能自动确定,需要人为设定。当时间序列问题转化为有监督机器学习问题时,mn的值决定了所选特征的个数,人为设定的特征选择容易造成维度灾难,对模型的预测精度产生负面影响。针对模型结构固定、时空相关性不明确的问题,Cheng等[21]提出一种自适应时空k近邻模型。首先,利用各路段的自相关性,确定各路段所需时间窗n的大小,利用不同路段间的互相关性分析路段时空相关性,为每个路段确定自适应的空间维数m。然后,使用自适应时空状态矩阵来表征状态空间。最后,利用自适应时空权值、自适应时空参数和高斯权值函数对k近邻模型进行优化,进一步捕获交通流的异质性。研究结果表明,自适应时空k近邻模型在所有时间段,特别是峰值期间取得较好的效果。

李巧茹等[22]提出时空支持向量机模型。首先,分析相邻路段流量曲线分布,说明交通流在相邻空间上具有相似性,从而选取本路段和相邻路段的时间和空间序列流量观测值作为支持向量机训练样本。然后,使用与待预测路段相关系数高的空间序列预测值对交通流时间序列预测结果进行修正,并分析待预测路段的历史时间和空间序列预测结果,动态更新预测过程中时间、空间序列预测值的权重。最后,自适应融合时空序列预测结果,得到预测模型。

2 交通流参数预测中的深度学习方法

传统深度学习方法如递归神经网络、长短时记忆网络和门控递归单元等方法仅考虑交通数据的时间特征,忽略道路网络的空间特征。虽然在预测准确性方面明显优于统计学习方法,但在区域预测方面仍有提升空间。因此,基于传统深度学习方法,为提高模型对空间特征的捕获能力,研究人员提出许多联合空间特征的深度学习方法。卷积神经网络的蓬勃发展,在交通领域也得到了广泛应用。通过将城市路网建模为二维栅格数据,基于卷积神经网络的时空交通流参数预测方法提升了预测准确性和区域预测能力。注意力机制的引入,提高了模型的可解释性,增强了联合时空特征的深度学习方法动态时空建模能力。

2.1 传统深度学习方法

深度学习方法可以基于交通大数据进行交通流参数预测,预测性能相比于统计学习方法显著提升。近年来,基于深度学习方法的交通流参数预测已成为一种新趋势[23],如前馈神经网络[24]、径向基神经网络[25]和递归神经网络(recurrent neural network,RNN)[26]等。其中,递归神经网络对于捕捉交通流时空演化效果较好。然而,以往的研究表明,递归神经网络由于存在梯度消失和梯度爆炸问题,不能捕捉到长期的演化过程[27]。为了解决该问题,长短时记忆(long short term memory,LSTM)网络[28]被应用于交通流预测。

长短时记忆网络是递归神经网络的变体,与递归神经网络相比,长短时记忆网络引入了门的概念,在网络内部设置3种不同类型的门:遗忘门、输入门、输出门。遗忘门决定要丢弃的信息,输入门决定要保存的新信息,输出门决定要输出到下一级的信息,门结构增强了网络信息处理能力。长短时记忆网络广泛应用于具有时间序列性质的问题,但因为长短时记忆网络预测误差随着序列长度的增加而增加,所以解决长期依赖问题的能力不足。受到注意力机制的启发,Yang等[29]提出一种改进的方法,首先,使用注意力机制从远距离时间序列中捕获具有高影响的时间步长;然后,将这些历史时间步长与当前时间步长建立联系,增强长短时记忆网络的长期依赖性;同时,对一些超出正常范围的数据进行平滑处理,减少异常数据对预测结果的影响。

Cho等[30]针对递归神经网络梯度消失和长短时记忆网络结构复杂的问题提出门控递归单元(gated recurrent unit,GRU)。将长短时记忆网络中的遗忘门和输入门组合在一起,形成门控递归单元中的更新门。更新门的功能是自适应地决定隐藏单元必须记住或遗忘多少内容,而单元的记忆通过重置门重置。门控递归单元网络包含的参数较少,训练速度较快,因此,门控递归单元的表现略好于长短时记忆网络。长短时记忆网络和门控递归单元由于具有处理长序列的能力而成为时间序列预测模型的首选,并且预测能力均优于传统统计学习方法。

为便于读者理解,将基于递归神经网络体系的传统深度学习交通流参数预测方法总结于图2中。如图2所示,早期用于交通流参数预测的深度学习方法为RNN[26,31-32],但由于RNN通过反向传播算法训练网络时容易出现梯度消失或梯度爆炸问题,且时间序列越长,问题越严重,从而无法捕获长时间序列中的依赖关系,于是LSTM[27-28]网络被用于交通流参数预测。虽然LSTM网络取得了不错的效果,但仍存在一些问题。LSTM网络的结构复杂性导致模型训练时间较长,另外,其对时间序列更深层的时间特征捕捉不充分。为了解决上述缺陷,LSTM网络的改进有以下两种思路:一是简化LSTM网络结构加快训练速度,于是GRU[3033]被提出;二是通过对单个LSTM网络进行重组和组合,基于LSTM设计出处理能力更强模型,于是LSTM+[29]、双向LSTM[34]、深层LSTM[35]、共享隐藏LSTM[36]和嵌套LSTM[37]等网络被提出。


图 2 递归神经网络方法及其发展 Fig. 2 Recurrent neural network method and its development
2.2 联合时空特征的深度学习方法

在深度学习领域,不少研究者尝试将传统深度学习方法拓展到联合时空特征的交通流参数预测当中。在过去的几年中,一些具有代表性的方法已经取得了较为理想的预测性能。Huang等[38]提出了一种具有多任务学习的深层信念网络,对交通流参数预测的深层结构网络进行探讨,并使用多任务回归层进行无监督特征学习。Lv等[39]提出一种基于叠加自动编码器的时空特征交通流预测方法,与以往只考虑交通数据浅层结构的方法不同,该方法能够成功地发现潜在的交通流特征表示,如交通数据的非线性时空相关性。以贪婪分层无监督学习算法对深度网络进行预训练,然后进行微调,更新模型参数,提高预测性能。

与上述深度学习方法不同,Zhao等[40]构造了一个基于存储单元的多层长短时记忆网络,使用全连通层和向量发生器将起点—目的地相关矩阵集成到长短时记忆网络。起点—目的地相关矩阵包含了路网中不同路段的时空相关性,有助于模型捕捉交通流时空特征。多层长短时记忆网络的两个维度直接表示时间轴和空间轴。与当时的大多数交通流参数预测方法相比,该方法具有更好的预测精度,同时满足实时性要求。

卷积神经网络(convolutional neural networks,CNN)在图像学习任务中表现良好[41]。在交通预测问题中,卷积神经网络具有以下优势:a.卷积神经网络的卷积层和池化层可以自动提取交通网络的时空特征,避免人为选择特征的困难;b.卷积神经网络可以处理网络范围内的交通信息,然后将这些特征信息用于预测网络范围内的交通流参数预测;c.卷积神经网络在卷积层中共享权重并采用池化机制,因此可以推广到大型交通网络。基于卷积神经网络的交通流参数预测方法能够自动提取交通网络的时空特征,该方法主要包含两个过程:第一个过程将网络流量转换为二维栅格图像,交通网络的时间和空间维度表示为栅格图像的两个维度。由于周围路段在栅格图像中是相邻的,因此可以保留时空信息。第二个过程是利用卷积神经网络的深度学习结构对栅格图像进行交通流参数预测。

利用卷积神经网络模型,Ma等[42]将交通网络转换为灰度栅格图像,使用二维时空矩阵表示时间和空间相关性,列数是用于预测的历史时间窗口数,行数是路段数。通过这种方式,矩阵的每个单元存储特定时间段的交通速度,然后二维卷积运算得到预测结果。与传统神经网络相比,该模型的平均精度显著提高。

值得注意的是:上述模型的线性矩阵表示仅适用于路网结构较简单的情况,对于更复杂的路网结构,此方法可能无法提取有用的空间特征。针对这一问题,Zhang等[43]提出了一种卷积神经网络结合长短时记忆网络的方法。首先,将交通网络转换成基于地理坐标的栅格地图。其次,将交通流量数据映射到栅格网格中,使得每个网格表示一个流量状态,并将这些网格数据输入到卷积神经网络中提取空间特征。然后,通过长短时记忆网络层对空间特征序列进行处理,获得时间特征。最后,通过全连接层生成输出。实验结果表明,该模型的预测性能优于长短时记忆网络、卷积神经网络和叠加自动编码器等其他深度学习模型。然而,模型的训练和测试过程非常耗时。Cui等[44]提出在卷积神经网络和长短时记忆网络的混合模型中使用自由流可达矩阵,即通过自由流速度下位置之间的可达性来确定相邻位置的相互影响,从而对相邻路段数据进行卷积,完成对交通网络的空间关系捕获。Dai等[45]根据历史数据计算位置之间的空间相关性。首先,将位置信息放置在一个方阵中,按照它们的标识符顺序排列。然后,使总空间相关性得分最大化,进行重新排列矩阵。最后,根据位置信息在矩阵中的位置,构造卷积神经网络的输入矩阵。

上述联合时空特征的交通流参数预测方法,具有处理交通网络时空特征的能力,并因此取得了不错的预测性能。但大多数模型只能应用于简单的路段序列的交通网络,并且模型往往考虑的是静态的时空相关性,即模型产生的时空相关性不会随着时间的推移而改变。除此之外,由于这类模型的黑箱性质,模型缺乏可解释性。这些原因在一定程度上影响了模型的准确性。

注意力机制是一种可以帮助神经网络识别输入中哪些部分更重要,从而在预测任务中给予更多关注的方法。这种机制的首次提出是为了提高机器翻译中序列到序列模型的性能[46],它在获取输入和输出之间相关性的同时,提高了神经网络模型的可解释性,是很有应用前景的方法。Cheng等[47]将注意力机制应用于相邻路段的不同顺序上,称为顺序槽。首先,应用卷积神经网络和长短时记忆网络的混合结构从每个目标位置的上游和下游位置的不同顺序槽中提取时空特征。然后,通过确定每个顺序槽与预测位置的不同相关性,在预测时给予每个顺序槽不同的权重。此外,Yao等[48]进行另一种尝试,即使用注意力机制来计算前几天考虑的每个时间步对目标日预测时间步的影响。这些应用分别展示了注意力机制在捕获交通数据空间和时间相关性的潜力。

Do等[49]提出基于时空注意力的序列到序列模型,通过卷积门控递归单元和注意力机制来捕获交通流的时空相关性,图3为使用注意力机制的序列到序列模型示意图。图中: ${X_{t - k + 1}},{X_{t - k + 2}}, \cdots , {X_t}$ 表示编码器相应时刻的输入;k为历史窗口数;Sj表示 $j$ 时刻隐藏状态;ai,j表示注意力权重;hi表示解码器中i时隐藏状态; ${\hat X_{t + 1}},{\hat X_{t + 2}}$ 分别表示 $t$ $ t + 1 $ 时估计值 ${\hat X_t},{\hat X_{t + 1}}$ 的输出。常用序列到序列模型只包括编码器和解码器,其中编码器和解码器通常是递归神经网络。编码器处理输入序列中的每一项,在特征向量中捕获该序列中的有用特征,特征向量转变为输入序列的特征。然后,将特征向量传递到解码器,解码器开始产生输出序列。这种方式的编码器无法在单个隐藏状态下完全捕获整个输入序列的时空特征。为了解决这个问题,Do等在序列到序列模型的基础上加入了注意力机制,这背后的原因是:在进行预测任务时,编码器中输入序列是顺序处理,因此最终状态倾向于最近输入信息。在交通流参数预测中,当预测未来5 min的状态时,这可能不是一个问题,因为在如此短的时间内通常参数不会有明显的变化。然而,对于未来1 h甚至更长的预测问题,可能会低估先前状态对当前时刻状态的影响。因此,在预测交通流参数时,在先前状态序列上采用注意力机制,对于每个预测步骤,在编码器的每个时刻产生的隐藏状态Sj获得环境向量,从而提高编码器捕捉长时间依赖的能力,注意力权重ai,j用于指定进行预测时,编码器的隐藏状态Sj应该注意多少。时空注意力神经网络尝试将注意力机制应用时间和空间维度的交通流量预测,该模型能够提供一定程度的时空相关性解释。


图 3 使用注意力机制的序列到序列模型[49] Fig. 3 Sequence-to-sequence model with attention[49]
3 交通流参数预测中的图神经网络方法

图神经网络(graph neural network,GNN)方法无论是在城市路网区域交通流参数预测中,还是在高速公路的交通流参数预测中都成效显著。由于路网的空间关系是动态的、复杂的,路网中的不同节点对待预测节点的影响随时间而变化,典型图卷积网络方法使用固定的拉普拉斯矩阵无法捕捉空间关系的动态变化。因此,引入注意力机制和使用不同的图神经网络,可加强模型对时空动态相关性的捕获能力,提高模型的可解释性。

3.1 典型图神经网络方法

尽管基于递归神经网络的方法可以学习空间相关性,但计算复杂且准确率不高,同时会捕获一定数量的噪声和伪关系。为了缓解这个问题,研究人员尝试使用卷积神经网络建立空间关系。然而,传统的卷积神经网络更适合于处理由二维矩阵或栅格图像表示的欧氏空间中的空间关系,忽略了更适合描述路网的非欧几里德成对关系的重要性[50]。因此,卷积神经网络学习的空间特征对于表示交通网络结构不是最优的。

基于谱图理论[50],卷积神经网络被推广到任意图结构数据。图神经网络的概念于2005年首次提出[51],并于2009年进一步得到阐述[52]。图神经网络在多个领域取得令人满意的效果,这些领域的数据通常以拓扑图的形式构成。与标准的神经网络不同,图神经网络包含一个状态变量,该变量可以表示任意深度的邻域信息,并且可以通过节点间的消息传递捕获图结构的相关性。通常,卷积神经网络用于提取图像或视频描述的网格结构数据的空间相关性,而图神经网络中的图卷积网络更适合描述具有图结构的交通路网的空间相关性。

由于道路网络可以使用图结构表示,许多基于图神经网络的交通流参数预测研究已经展开。Li等[53]将交通流量的空间相关性建模为有向图上的扩散过程,提出扩散卷积递归神经网络捕获图结构数据的时空相关性。Seo等[54]提出将图卷积与递归神经网络相结合的图卷积递归网络方法。Yu等[55]提出一种带门控机制的图卷积神经网络,避免了递归神经网络的复杂结构,保留了模型捕获长期时间相关性的能力。

为了更好地捕捉时间和空间的相关性,Zhao等[56]提出时态图卷积网络模型,由图卷积网络和门控递归单元两部分组成。图4为时态图卷积网络模型示意图。图中: ${X_{t - n}}, \cdots ,{X_{t - 1}},{X_t}$ 表示前n个历史数据为模型输入; ${X_{t + T}}$ 为模型输出; $T$ 为预测步长。如图4所示,首先,以前n个历史时刻序列数据作为输入,通过图卷积学习城市道路的拓扑结构,获得城市道路网的空间特征。然后,将得到的具有空间特征的时间序列输入到门控递归单元中,通过单元间信息传递获得序列的时间特征。最后,通过全连接层得到预测结果。


图 4 时态图卷积网络模型[56] Fig. 4 Temporal graph convolutional network model[56]

在考虑数据的周期性时,有些模型只是简单地将原始时间序列作为模型的输入,不考虑由于周期数据的差异。此外,有些模型只考虑了道路的连通性,在一定范围内捕捉到了目标道路与其所有相邻道路之间的时空相关性,忽略了道路间交通模式变化所引起的时空相关性。Guo等[57]结合注意力机制和数据周期特性,提出了一种基于注意力的时空图卷积网络。在此基础上,Li等[58]考虑到周期数据的差异性和交通流模式的变化关系,提出多传感器数据相关图卷积网络,如图5所示。图中:Xh表示最近数据;Xd表示日周期数据;Xw表示周周期数据;Yh表示最近数据预测结果;Yd表示日周期数据预测结果;Yw表示周周期数据预测结果; $\hat Y$ 为各分量综合预测值;Y为训练数据的真实值。由图5可见,模型由3部分组成:最近期、日周期和周周期分量,每部分又由两个模块组成,即基准自适应模块和多传感器数据相关卷积模块。该模型首先使用基准自适应模块考虑周期性数据之间的差异,对周期分量进行预处理提高输入数据质量。其次,使用多传感器数据相关卷积块考虑道路间交通模式之间的变化关系,结合交通拓扑网络和交通模式关系图来捕捉长期的时空变化相关性。然后,在时间维度上采用标准的二维卷积,同时捕捉道路之间的动态时空相关性。最后,将各分量产生的预测值融合得到最终预测值。


图 5 多传感器数据相关图卷积模型[58] Fig. 5 Multisensor data correlation graph convolution model[58]
3.2 改进的图神经网络方法

随着对图的深入研究,图卷积网络及其变体等方法被广泛应用于时空图数据预测任务中,并取得良好性能。由于整个路网交通流之间复杂的时空依赖性和不同条件下尖锐的非线性和动态性,使得交通流参数预测任务具有挑战性。近年来,一些关于图结构数据节点分类的研究取得了很大的成果。受此启发,Wu等[59]将重点放在图结构注意力网络上,将交通流参数预测定义为图的时间序列预测问题,提出图注意力长短时记忆网络。通过叠加多个图注意力长短时记忆网络层,建立序列到序列可训练编码器预测模型,解决了预测中动态性问题。

为了捕获复杂的局部时空相关性和时空数据的异质性,Song等[60]提出一种时空同步图卷积模型。与以往模型使用不同类型的深层神经网络分别对空间相关性和时间相关性进行建模不同,该模型可以同时直接捕获局部时空相关性。具体地说,模型构造的局部时空图将相邻时间步的单个空间图连接成一个图。然后构造时空同步图卷积模块,用于捕获这些局部时空图中复杂的局部时空相关性。图6为时空同步图卷积模型示意图。由图6可见,首先,通过具有激活功能的全连接层将节点的特征转换为新的空间。其次,使用时空同步图卷积模块对滑动窗口切出的不同周期序列建模,捕获整个网络序列的长期时空相关性,并将多个时空同步图卷积组合构成时空同步图卷积层,以提取远程时空特征。然后,将多个时空同步图卷积层堆叠在一起,聚集长期的时空相关性和异质性进行预测。最后,通过全连接层的转换得到预测目标时空网络序列。


图 6 时空同步图卷积模型[60] Fig. 6 Spatial-temporal synchronous graph convolutional model[60]

为解决异质数据之间的内部耦合和动态时空关系,Yin等[61]提出一种新的交通预测模型:多阶段注意力时空图网络。该模型包含3种注意力机制:内部注意力、空间注意力和时间注意力,它们共同模拟道路网络异质数据之间的内部耦合关系和动态时空关系。内部注意力机制用于模拟同一传感器采集的异质数据之间的内部交互和耦合关系,以便更好地探索数据之间的关系,从而为预测的目标序列提供有效的补充信息。空间注意力机制用于模拟动态的空间依赖。与一般的基于注意力的方法忽略路网结构信息不同,文献[61]首先采用邻接关系作为先验,将所有节点划分为不同的集合;然后应用注意力机制动态捕捉同一有序邻域内和不同邻域间的空间相关性。因此,该模型可以学习不同节点随时间的动态变化,并捕捉全局空间相关性。

4 总结与展望

本文回顾了近20年来的交通流参数预测领域的发展。在时间特征提取方面:传统统计学习方法对复杂和非线性交通数据的处理能力有限,随着人工智能技术的快速发展,递归神经网络和长短时记忆网络以及它们的变体被不断提出,提高了模型对复杂和非线性交通时序数据的处理能力。在空间特征提取方面:由于空间特征的复杂性,早期通过设置空间矩阵等类似方法对交通流参数预测性能的提升并不显著。卷积神经网络技术的应用,使得模型能够自动提取道路的空间特征,提高了预测的准确率以及空间特征利用率。基于谱图理论,图神经网络的推广与应用,使得模型提取空间特征的能力有了质的区别,预测模型也更符合道路实际情况。在联合时空特征方面:早期是通过在时间序列处理方法中嵌入道路的空间特征矩阵,来完成联合时空特征交通流预测,随着空间特征建模方法的改进,时空特征的联合方法也更加灵活,并且更加注重时空特征的动态相关性,或将时空特征作为一个整体进行预测模型的输入。

联合时空特征的交通流参数预测方法在实际应用中取得较好的效果,但利用模型深入挖掘时空数据的内在模式及时空动态相关性,有待进一步研究,未来可以从以下角度进行深入探究。

a. 模型输入角度。首先,现在大多数预测方法的输入都是单特征,即速度或者流量数据中的一种,但是速度和流量数据存在内在关联,因此可以利用双特征或多特征进行交通流参数的预测。其次,需要更加关注交通时序数据的时间特征、周期性特征和事件特征等各种全局特征。最后,模型输入不仅要考虑交通数据内部因素,也需要考虑一些外部因素(如天气、节假日和交通指数等),以进一步提高预测的准确性。

b. 模型设计角度。方法一:利用历史交通数据判断并识别出各道路之间的语义,区分具有类似功能的城市区域(如住宅区和商业区),进而挖掘道路之间的非欧式空间关联和潜在的语义联系,提高捕获空间依赖关系的可靠性与解释性。方法二:利用注意力机制增强模型时空动态性的捕获能力。在动态路网中,单个节点的时空特征依赖性受路网整体相互作用以及随机性的影响,注意力机制是解决其动态性的一个很好的方向。因此,需要进一步研究注意力机制在联合时空特征的交通流参数预测模型上的深度应用。

参考文献
[1]
王殿海, 曲昭伟. 对交通流理论的再认识[J]. 交通运输工程学报, 2001, 1(4): 55-59. DOI:10.3321/j.issn:1671-1637.2001.04.013
[2]
GREENBERG H. An analysis of traffic flow[J]. Operations Research, 1959, 7(1): 79-85. DOI:10.1287/opre.7.1.79
[3]
潘志松, 黎维. 基于深度学习的时空序列预测方法综述[J]. 数据采集与处理, 2021, 36(3): 436-448.
[4]
刘静, 关伟. 交通流预测方法综述[J]. 公路交通科技, 2004, 21(3): 82-85. DOI:10.3969/j.issn.1002-0268.2004.03.022
[5]
SMITH B L, DEMETSKY M J. Traffic flow forecasting: comparison of modeling approaches[J]. Journal of Transportation Engineering, 1997, 123(4): 261-266. DOI:10.1061/(ASCE)0733-947X(1997)123:4(261)
[6]
HAMED M M, AL-MASAEID H R, SAID Z M B. Short-term prediction of traffic volume in urban arterials[J]. Journal of Transportation Engineering, 1995, 121(3): 249-254. DOI:10.1061/(ASCE)0733-947X(1995)121:3(249)
[7]
WILLIAMS B M, HOEL L A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: theoretical basis and empirical results[J]. Journal of Transportation Engineering, 2003, 129(6): 664-672. DOI:10.1061/(ASCE)0733-947X(2003)129:6(664)
[8]
VAN DER VOORT M, DOUGHERTY M, WATSON S. Combining kohonen maps with ARIMA time series models to forecast traffic flow[J]. Transportation Research Part C:Emerging Technologies, 1996, 4(5): 307-318. DOI:10.1016/S0968-090X(97)82903-8
[9]
WILLIAMS B M. Multivariate vehicular traffic flow prediction: evaluation of ARIMAX modeling[J]. Transportation Research Record:Journal of the Transportation Research Board, 2001, 1776(1): 194-200. DOI:10.3141/1776-25
[10]
贺国光, 李宇, 马寿峰. 基于数学模型的短时交通流预测方法探讨[J]. 系统工程理论与实践, 2000, 20(12): 51-56. DOI:10.3321/j.issn:1000-6788.2000.12.008
[11]
WU C H, HO J M, LEE D T. Travel-time prediction with support vector regression[J]. IEEE Transactions on Intelligent Transportation Systems, 2004, 5(4): 276-281. DOI:10.1109/TITS.2004.837813
[12]
SMOLA A J, SCHÖLKOPF B. A tutorial on support vector regression[J]. Statistics and Computing, 2004, 14(3): 199-222. DOI:10.1023/B:STCO.0000035301.49549.88
[13]
ZHANG Y, LIU Y C. Traffic forecasting using least squares support vector machines[J]. Transportmetrica, 2009, 5(3): 193-213. DOI:10.1080/18128600902823216
[14]
WESTGATE B S, WOODARD D B, MATTESON D S, HENDERSON S G. Travel time estimation for ambulances using Bayesian data augmentation[J]. The Annals of Applied Statistics, 2013, 7(2): 1139-1161.
[15]
DAVIS G A, NIHAN N L. Nonparametric regression and short-term freeway traffic forecasting[J]. Journal of Transportation Engineering, 1991, 117(2): 178-188. DOI:10.1061/(ASCE)0733-947X(1991)117:2(178)
[16]
MORETTI F, PIZZUTI S, PANZIERI S, et al. Urban traffic flow forecasting through statistical and neural network bagging ensemble hybrid modeling[J]. Neurocomputing, 2015, 167: 3-7. DOI:10.1016/j.neucom.2014.08.100
[17]
KAMARIANAKIS Y, PRASTACOS P. Space–time modeling of traffic flow[J]. Computers & Geosciences, 2005, 31(2): 119-133.
[18]
于滨, 邬珊华, 王明华, 等. K近邻短时交通流预测模型 [J]. 交通运输工程学报, 2012, 12(2): 105-111. DOI:10.3969/j.issn.1671-1637.2012.02.017
[19]
WU S H, YANG Z Z, ZHU X C, et al. Improved k-nn for short-term traffic forecasting using temporal and spatial information [J]. Journal of Transportation Engineering, 2014, 140(7): 04014026. DOI:10.1061/(ASCE)TE.1943-5436.0000672
[20]
CAI P L, WANG Y P, LU G Q, et al. A spatiotemporal correlative k-nearest neighbor model for short-term traffic multistep forecasting [J]. Transportation Research Part C:Emerging Technologies, 2016, 62: 21-34. DOI:10.1016/j.trc.2015.11.002
[21]
CHENG S F, LU F, PENG P, et al. Short-term traffic forecasting: an adaptive ST-KNN model that considers spatial heterogeneity[J]. Computers, Environment and Urban Systems, 2018, 71: 186-198. DOI:10.1016/j.compenvurbsys.2018.05.009
[22]
李巧茹, 赵蓉, 陈亮. 基于SVM与自适应时空数据融合的短时交通流量预测模型[J]. 北京工业大学学报, 2015, 41(4): 597-602.
[23]
代亮, 梅洋, 钱超, 等. 基于深度学习的短时交通量预测研究综述[J]. 计算机科学, 2019, 46(3): 39-47. DOI:10.11896/j.issn.1002-137X.2019.03.005
[24]
PARK D, RILETT L R. Forecasting freeway link travel times with a multilayer feedforward neural Network[J]. Computer-Aided Civil and Infrastructure Engineering, 1999, 14(5): 357-367. DOI:10.1111/0885-9507.00154
[25]
ZHU J Z, CAO J X, FAN Y. Short-term traffic flow prediction based on flocking theory and RBF neural network[C]//2nd International Conference on Transportation Information and Safety (ICTIS). Wuhan: ASCE, 2013: 954–959.
[26]
LINGRAS P, SHARMA S, ZHONG M. Prediction of recreational travel using genetically designed regression and time-delay neural network models[J]. Transportation Research Record:Journal of the Transportation Research Board, 2002, 1805(1): 16-24. DOI:10.3141/1805-03
[27]
MA X L, TAO Z M, WANG Y H, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C:Emerging Technologies, 2015, 54: 187-197. DOI:10.1016/j.trc.2015.03.014
[28]
HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780. DOI:10.1162/neco.1997.9.8.1735
[29]
YANG B L, SUN S L, LI J Y, et al. Traffic flow prediction using LSTM with feature enhancement[J]. Neurocomputing, 2019, 332: 320-327. DOI:10.1016/j.neucom.2018.12.016
[30]
CHO K, VAN MERRIËNBOER B, GÜLÇEHRE Ç, et al. Learning phrase representations using RNN encoder–decoder for statistical machine translation[C]//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). Doha: ACL, 2014: 1724–1734.
[31]
ZHANG H M. Recursive prediction of traffic conditions with neural network models[J]. Journal of Transportation Engineering, 2000, 126(6): 472-481. DOI:10.1061/(ASCE)0733-947X(2000)126:6(472)
[32]
ISHAK S, KOTHA P, ALECSANDRU C. Optimization of dynamic neural network performance for short-term traffic prediction[J]. Transportation Research Record:Journal of the Transportation Research Board, 2003, 1836(1): 45-56. DOI:10.3141/1836-07
[33]
FU R, ZHANG Z, LI L. Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC). Wuhan: IEEE, 2016: 324–328.
[34]
CUI Z Y, KE R M, WANG Y H. Deep stacked bidirectional and unidirectional LSTM recurrent neural network for network-wide traffic speed prediction[C]//6th International Workshop on Urban Computing (UrbComp 2017). Halifax, 2017.
[35]
YU R, LI Y G, SHAHABI C, et al. Deep learning: a generic approach for extreme condition traffic forecasting[C]//Proceedings of the 2017 SIAM International Conference on Data Mining. Houston: SIAM, 2017: 777–785.
[36]
YU R, LI Y G, SHAHABI C, et al. Deep learning: a generic approach for extreme condition traffic forecasting[C]//Proceedings of the 2017 SIAM International Conference on Data Mining. Houston: SIAM, 2017.
[37]
MA X L, ZHONG H Y, LI Y, et al. Forecasting transportation network speed using deep capsule networks with nested LSTM models[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 22(8): 4813-4824. DOI:10.1109/TITS.2020.2984813
[38]
HUANG W H, SONG G J, HONG H K, et al. Deep architecture for traffic flow prediction: deep belief networks with multitask learning[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(5): 2191-2201. DOI:10.1109/TITS.2014.2311123
[39]
LV Y S, DUAN Y J, KANG W W, et al. Traffic flow prediction with big data: a deep learning approach[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 16(2): 865-873.
[40]
ZHAO Z, CHEN W H, WU X M, et al. LSTM network: a deep learning approach for short-term traffic forecast[J]. IET Intelligent Transport Systems, 2017, 11(2): 68-75. DOI:10.1049/iet-its.2016.0208
[41]
周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6): 1229-1251. DOI:10.11897/SP.J.1016.2017.01229
[42]
MA X L, DAI Z, HE Z B, et al. Learning traffic as images: a deep convolutional neural network for large-scale transportation network speed prediction[J]. Sensors, 2017, 17(4): 818. DOI:10.3390/s17040818
[43]
ZHANG J B, ZHENG Y, QI D K. Deep spatio-temporal residual networks for citywide crowd flows prediction[C]//Proceedings of the 31st AAAI Conference on Artificial Intelligence. San Francisco: AAAI, 2017: 1655–1661.
[44]
CUI Z Y, HENRICKSON K, KE R M, et al. Traffic graph convolutional recurrent neural network: a deep learning framework for network-scale traffic learning and forecasting[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(11): 4883-4894. DOI:10.1109/TITS.2019.2950416
[45]
DAI X Y, FU R, ZHAO E M, et al. DeepTrend 2.0: a light-weighted multi-scale traffic prediction model using detrending[J]. Transportation Research Part C:Emerging Technologies, 2019, 103: 142-157. DOI:10.1016/j.trc.2019.03.022
[46]
DO L N N, TAHERIFAR N, VU H L. Survey of neural network-based models for short-term traffic state prediction[J]. WIREs:Data Mining and Knowledge Discovery, 2019, 9(1): e1285.
[47]
CHENG X Y, ZHANG R Q, ZHOU J, et al. DeepTransport: learning spatial-temporal dependency for traffic condition forecasting[C]//2018 International Joint Conference on Neural Networks (IJCNN). Rio de Janeiro: IEEE, 2018: 1–8.
[48]
YAO H X, TANG X F, WEI H, et al. Revisiting spatial-temporal similarity: a deep learning framework for traffic prediction[C]//Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence and Thirty-First Innovative Applications of Artificial Intelligence Conference and Ninth AAAI Symposium on Educational Advances in Artificial Intelligence. Honolulu: AAAI, 2019: 695.
[49]
DO L N N, VU H L, VO B Q, et al. An effective spatial-temporal attention based neural network for traffic flow prediction[J]. Transportation Research Part C:Emerging Technologies, 2019, 108: 12-28. DOI:10.1016/j.trc.2019.09.008
[50]
WU Z H, PAN S R, CHEN F W, et al. A comprehensive survey on graph neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(1): 4-24. DOI:10.1109/TNNLS.2020.2978386
[51]
GORI M, MONFARDINI G, SCARSELLI F. A new model for learning in graph domains[C]//IEEE International Joint Conference on Neural Networks. Montreal: IEEE, 2005: 729–734.
[52]
SCARSELLI F, GORI M, TSOI A C, et al. The graph neural network model[J]. IEEE Transactions on Neural Networks, 2009, 20(1): 61-80. DOI:10.1109/TNN.2008.2005605
[53]
LI Y G, YU R, SHAHABI C, et al. Diffusion convolutional recurrent neural network: data-driven traffic forecasting[C]//International Conference on Learning Representations (ICLR). Vancouver: ICLR, 2018: 1–14.
[54]
SEO Y, DEFFERRARD M, VANDERGHEYNST P, et al. Structured sequence modeling with graph convolutional recurrent networks[C]//25th International Conference on Neural Information Processing. Siem Reap: Springer, 2018: 362–373.
[55]
YU B, YIN H T, ZHU Z X. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]//Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence. Stockholm: IJCAI, 2018: 3634–3640.
[56]
ZHAO L, SONG Y J, ZHANG C, et al. T-GCN: a temporal graph convolutional network for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(9): 3848-3858. DOI:10.1109/TITS.2019.2935152
[57]
GUO S N, LIN Y F, FENG N, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]//The Thirty-Third AAAI Conference on Artificial Intelligence (AAAI-19). Honolulu: AAAI, 2019: 922–929.
[58]
LI W, WANG X, ZHANG Y W, et al. Traffic flow prediction over muti-sensor data correlation with graph convolution network[J]. Neurocomputing, 2021, 427: 50-63. DOI:10.1016/j.neucom.2020.11.032
[59]
WU T L, CHEN F, WAN Y. Graph attention LSTM network: a new model for traffic flow forecasting[C]//2018 5th International Conference on Information Science and Control Engineering (ICISCE). Zhengzhou: IEEE, 2018: 241–245.
[60]
SONG C, LIN Y F, GUO S N, et al. Spatial-temporal synchronous graph convolutional networks: a new framework for spatial-temporal network data forecasting[C]//The Thirty-Fourth AAAI Conference on Artificial Intelligence. New York: AAAI, 2020: 914–921.
[61]
YIN X Y, WU G Z, WEI J Z, et al. Multi-stage attention spatial-temporal graph networks for traffic prediction[J]. Neurocomputing, 2021, 428: 42-53. DOI:10.1016/j.neucom.2020.11.038