本文详细介绍了扩散卷积的相关知识以及论文DCRNN的研究内容和成果
介绍
- 基本目标是构建一个速度传感器网络,通过给定的历史速度数据以及潜在的道路网络,预测交通情况(速度)
- 挑战性主要在于时空关联性以及长程预测问题的内在复杂性
- 交通序列的动态变化性——不断出现的特殊事件例如交通事故和上下班高峰导致了不稳定性,使长期预测变得不可靠
- 道路网络上的交通传感器具备独特的空间关联性——非欧且有向
交通预测数十年的发展可以分为两个范畴:知识驱动和数据驱动
- 知识驱动的方法需要用到排队论并模拟交通中的用户行为
- 数据驱动的方法依赖静态假设,容易和实际的交通数据相违背
之前的数据驱动的方法有的没能建模空间联系、有的用CNN提取空间联系但是是在欧氏空间中建模,还有的在图上建模但是是在无向图上
本文用有向图的节点代表传感器,边的权重表示传感器之间的近似性(时空),将动态的交通流当成广播过程建模并且提出了广播卷积(diffusion convolution)操作来捕获空间依赖并提出了应用了广播卷积的广播卷积循环神经网络(DCRNN)。
方法论
交通预测问题
目标是预测根据给定的
空间依赖建模
把交通流和扩散过程相结合,以抓住交通流动态数据随机性的本质。其中用到了图上的random walk和diffusion convolution,先介绍该知识:
本文中,扩散过程可以表示为——在图
其中
扩散卷积则被表示为:
其中
由上述可以定义扩散卷积层,一个将
其中
时间动态建模
采用循环神经网络建模,使用门控循环单元(GRU),把线性层替换为扩散卷积,形成本文提出的扩散卷积门控单元(DCGRU)
其中
在多步预测过程中采用编码器-解码器的结构,且均为DCGRU。训练过程中,将历史时间序列数据投入编码器中,并且用最终状态初始化解码器。解码器通过和ground truth比对生成预测:
实验
在两个数据集METR-LA和PEMS-BAY上进行实验,实验中将交通读数数据分为5分钟一个窗口,采取Z-Score分割法,70%的数据用以训练,20%用以测试,10%用以验证。为了构建传感器图,采用阈值高斯核构建邻接矩阵
实验设置
将DCRNN和其他广泛应用的时间序列回归模型对比:
- HA
- ARIMA
- VAR
- SVR
- FNN
- FC-LSTM
交通预测表现对比
设定metrics:
- MAE
- MAPE
- RMSE
原文
如果您喜欢此博客或发现它对您有用,则欢迎对此发表评论。 也欢迎您共享此博客,以便更多人可以参与。 如果博客中使用的图像侵犯了您的版权,请与作者联系以将其删除。 谢谢 !