AGCRN:Adaptive Graph Convolutional Recurrent Network

AGCRN以及图谱卷积相关介绍

Posted by Ccloud on 2023-01-10
Estimated Reading Time 7 Minutes
Words 2.1k In Total
Viewed Times

本文详细介绍了论文AGCRN的研究内容和成果

介绍

智能交通系统的发展仰仗着交通预测技术的发展,而交通预测的难点在于复杂的内部依赖关系(同一个交通序列的时间联系)和相互依赖关系(不同交通序列的空间联系)。传统方法例如自回归整体均值移动(ARIMA)和向量自回归(VAR)都只采用了时间序列建模,他们不能捕获非线性关系和大规模交通数据中错综复杂的时空关联。而基于深度学习的方法仅仅用循环神经网络建模时间关联——用长短记忆网络和门电路卷积单元;用基于图卷积神经网络(GCN)的方法建模非结构化的交通序列数据以及他们的内在联系。这样构建的模型只对于所有交通序列中突出且共有的模式非常敏感,却无法普适而精确地捕获所有的特定模式。这是因为时间序列可能表达多种多样的模式,然而基于图卷积升级网络的方法却需要预定义一个构建好内部联系的图来捕获空间关联性,而这个过程非常得直觉化,经验性,不完整性,故而对于特定的预测任务并没有直观联系。

而本文为了解决以上问题通过修改现有方法的基本模块提出了两个相对简明的机制。是为了增强图卷积神经网络而提出的两个适应性的模块:1)一个节点参数适应学习模块(NAPL)用来为每个交通序列学习节点相关的模式;2)一个数据适应图生成模块(DAGG)用以根据数据来推理节点结构和属性嵌入。以上两个模块互相独立且可以被分别或是独立地应用于现存的基于图卷积神经网络的交通预测模型。更进一步,这两个模块可以和循环神经网络组合起来,提出一个整合好的交通预测模型AGCRN,它可以捕获精确的特定节点交通序列中的时空关联并且整合内嵌进入DAGG模块。训练AGCRN可以对于每个交通序列源创造一个有意义的节点表达向量。这些表达可以被潜在应用于其他任务。

相关工作

  • 相关时间序列预测——LSTM和GRU,但都不能兼顾空间关联

  • 基于图卷积神经网络的交通预测,例如DCRNN和Graph WaveNet,以及更新的ASTGCN、STSGCN和GMAN,但是他们均不能捕获动态的时空关联性,只能捕获交通序列间共有的时空关系并且严重依赖预定义的图

方法论

问题定义

考虑相关性时间序列,其中代表N个信源在时间戳t时发出的信号,目标是基于历史观测值预测未来的值,问题可以形式化为找到一个函数,基于过去步的历史数据预测未来步的数据:

其中表示模型中所有可学习的参数。为了精确地大批量不同变量之间的空间关联,可以进一步在图上表示,其中是顶点集,代表信源,是边集,是图的邻接矩阵,代表信源间的关系(空间距离或是相似度),因此,问题可以被表示为:

节点适应性参数学习(NAPL)

许多关于交通预测的工作都倾向于用GCN捕获交通序列间的空间关系并遵循在谱域上计算的原则,图卷积可以被一阶切比雪夫不等式较好地近似,大致过程可以总结为如下推导:

令卷积核且应用切比雪夫不等式近似:

切比雪夫不等式的递推公式为:

而只采用一阶切比雪夫不等式近似,就可以简化为:

又已知且其中L为归一化图拉普拉斯矩阵

故而原式为,令再加上偏置项就有

,当将输入输出扩展成整个网络,则有:

𝕓

其中是邻接矩阵,是度矩阵,

分别是GCN层的输入和输出,𝕓表示可学习的参数和偏置

扩展后的可以看作是多节点共享参数,而最坏情况也可以学习成对角矩阵(右乘对角矩阵相当于对于原矩阵同一列乘相同的放缩系数,即和扩展前的含义一致)

虽然上述方式可以快速学习多节点所共有的显著模式并能显著降低参数量,但是用于交通预测问题时却有一些不足:由于交通时序数据的多样性,即便是相邻节点的交通流量也可能由于一些特定的属性表现出不相似的模式,而来自于不连接的节点的交通序列可能表现出相反的模式。故而仅仅捕获所有节点所共有的模式并不能用于精确的交通预测,需要对于每个节点维护一个独立的参数空间进行参数学习。

对于扩大的参数空间,对其进行分解从而减少计算复杂度,,其中。从单节点的视角来看,该因式分解相当于为节点从参数池中提取参数(根据分量),同理,

数据自适应图生成(DAGG)

基于GCN的预测模型的另外一个问题就是需要一个预定义的邻接矩阵用以图卷积操作。现存方法主要以两种方式定义矩阵:1)地理距离;2)相似度。然而这些都较为直觉化,不能包含完整的空间依赖且不和具体的预测任务直接相关。并且不能给其他领域不具备相关知识的工作人员直接应用,使得其较为低效。

为了解决上述问题,提出一个新颖的模块——数据自适应图生成模块(DAGG),用以根据数据自动推理隐藏的内部联系。该模块首先为所有节点初始化一个节点嵌入表示词典,其每一行代表节点的嵌入表示,代表节点嵌入空间的维数。参照定义图时用得节点相似度,新的节点间的相似度可以用表示:

这样操作可以避免生成和计算,直接算出,在训练过程中,可以自动更新来学习不同交通序列间的隐藏细节并且为图卷积算出自适应性矩阵:

自适应图卷积循环神经网络(AGCRN)

除了空间关联,交通预测还涉及复杂的时间关联性。这部分提出了AGCRN——组合了NAPL、DAGG以及Gated Recurrent Units(GRU),即将上述机制结合得到新的图卷积,并且将这种图卷积集成到GRU中替代原有的线性层同时捕捉交通数据中的时空依赖,整个模型可以形式化表示为如下:

是时间戳t的输入和输出,表示连接操作,是重置门和更新门。以及都是模型AGCRN中的可学习参数。

多步交通预测

使用AGCRN作为编码器捕获历史序列中的时空依赖,并且直接使用线性变换将编码器最后一步的输出转换为未来多步的序列预测值,其中表示未来序列的长度,使用损失函数:

其中代表所有可学习参数,代表gt,代表所有节点在时间戳时的预测值

实验

数据集

此文使用公开的PEMS04与PEMS08两个交通数据集

实验设置

将AGCRN与领域所有的高性能模型进行对比:

  1. Historical Average (HA)
  2. Vector Auto-Regression (VAR)
  3. GRU-ED
  4. DSANet
  5. DCRNN
  6. STGCN
  7. ASTGCN
  8. STSGCN

comparison

metrics

使用了三个广泛使用的metrics——- Mean Absolute Error (MAE), Root Mean Square Error(RMSE), and Mean Absolute Percentage Error (MAPE)

原文


如果您喜欢此博客或发现它对您有用,则欢迎对此发表评论。 也欢迎您共享此博客,以便更多人可以参与。 如果博客中使用的图像侵犯了您的版权,请与作者联系以将其删除。 谢谢 !