本文详细介绍了论文AGCRN的研究内容和成果
介绍
智能交通系统的发展仰仗着交通预测技术的发展,而交通预测的难点在于复杂的内部依赖关系(同一个交通序列的时间联系)和相互依赖关系(不同交通序列的空间联系)。传统方法例如自回归整体均值移动(ARIMA)和向量自回归(VAR)都只采用了时间序列建模,他们不能捕获非线性关系和大规模交通数据中错综复杂的时空关联。而基于深度学习的方法仅仅用循环神经网络建模时间关联——用长短记忆网络和门电路卷积单元;用基于图卷积神经网络(GCN)的方法建模非结构化的交通序列数据以及他们的内在联系。这样构建的模型只对于所有交通序列中突出且共有的模式非常敏感,却无法普适而精确地捕获所有的特定模式。这是因为时间序列可能表达多种多样的模式,然而基于图卷积升级网络的方法却需要预定义一个构建好内部联系的图来捕获空间关联性,而这个过程非常得直觉化,经验性,不完整性,故而对于特定的预测任务并没有直观联系。
而本文为了解决以上问题通过修改现有方法的基本模块提出了两个相对简明的机制。是为了增强图卷积神经网络而提出的两个适应性的模块:1)一个节点参数适应学习模块(NAPL)用来为每个交通序列学习节点相关的模式;2)一个数据适应图生成模块(DAGG)用以根据数据来推理节点结构和属性嵌入。以上两个模块互相独立且可以被分别或是独立地应用于现存的基于图卷积神经网络的交通预测模型。更进一步,这两个模块可以和循环神经网络组合起来,提出一个整合好的交通预测模型AGCRN,它可以捕获精确的特定节点交通序列中的时空关联并且整合内嵌进入DAGG模块。训练AGCRN可以对于每个交通序列源创造一个有意义的节点表达向量。这些表达可以被潜在应用于其他任务。
相关工作
-
相关时间序列预测——LSTM和GRU,但都不能兼顾空间关联
-
基于图卷积神经网络的交通预测,例如DCRNN和Graph WaveNet,以及更新的ASTGCN、STSGCN和GMAN,但是他们均不能捕获动态的时空关联性,只能捕获交通序列间共有的时空关系并且严重依赖预定义的图
方法论
问题定义
考虑相关性时间序列
其中
节点适应性参数学习(NAPL)
许多关于交通预测的工作都倾向于用GCN捕获交通序列间的空间关系并遵循在谱域上计算的原则,图卷积可以被一阶切比雪夫不等式较好地近似,大致过程可以总结为如下推导:
令卷积核
切比雪夫不等式的递推公式为:
而只采用一阶切比雪夫不等式近似,就可以简化为:
又已知
故而原式为
其中
分别是GCN层的输入和输出,
扩展后的
虽然上述方式可以快速学习多节点所共有的显著模式并能显著降低参数量,但是用于交通预测问题时却有一些不足:由于交通时序数据的多样性,即便是相邻节点的交通流量也可能由于一些特定的属性表现出不相似的模式,而来自于不连接的节点的交通序列可能表现出相反的模式。故而仅仅捕获所有节点所共有的模式并不能用于精确的交通预测,需要对于每个节点维护一个独立的参数空间进行参数学习。
对于扩大的参数空间
数据自适应图生成(DAGG)
基于GCN的预测模型的另外一个问题就是需要一个预定义的邻接矩阵
为了解决上述问题,提出一个新颖的模块——数据自适应图生成模块(DAGG),用以根据数据自动推理隐藏的内部联系。该模块首先为所有节点初始化一个节点嵌入表示词典
这样操作可以避免生成
自适应图卷积循环神经网络(AGCRN)
除了空间关联,交通预测还涉及复杂的时间关联性。这部分提出了AGCRN——组合了NAPL、DAGG以及Gated Recurrent Units(GRU),即将上述机制结合得到新的图卷积,并且将这种图卷积集成到GRU中替代原有的线性层同时捕捉交通数据中的时空依赖,整个模型可以形式化表示为如下:
多步交通预测
使用AGCRN作为编码器捕获历史序列中的时空依赖,并且直接使用线性变换将编码器最后一步的输出
其中
实验
数据集
此文使用公开的PEMS04与PEMS08两个交通数据集
实验设置
将AGCRN与领域所有的高性能模型进行对比:
- Historical Average (HA)
- Vector Auto-Regression (VAR)
- GRU-ED
- DSANet
- DCRNN
- STGCN
- ASTGCN
- STSGCN
metrics
使用了三个广泛使用的metrics——- Mean Absolute Error (MAE), Root Mean Square Error(RMSE), and Mean Absolute Percentage Error (MAPE)
原文
如果您喜欢此博客或发现它对您有用,则欢迎对此发表评论。 也欢迎您共享此博客,以便更多人可以参与。 如果博客中使用的图像侵犯了您的版权,请与作者联系以将其删除。 谢谢 !