我一直在通过谷歌BigQuery访问NOAA GSOD的每日历史数据。我感兴趣的是长期的时间序列的雪,降水,并在较小程度上温度为伏尔加盆地周围的地区。
首先,我查看了位于俄罗斯戈罗季茨附近的274530气象站,并注意到数据中有一些奇怪的地方。积雪深度在短时间内会发生显著变化。这似乎不是系统识别的“错误”或“缺乏读取”代码,根据文档和数据,这通常是999。
(请原谅我的红色涂鸦)。
我不知道如何处理这个数据,它不是“缺失”。我对潜在的物理系统没有很好的理解,但我怀疑雪的水平不会像上图那样突然变化,只是在第二天恢复到类似的水平。
我应该如何解释这些数据,我应该采取什么行动来“清理”它(如果有的话)?最终,我希望对这些数据有信心,这样我就可以将其用于数百个气象站的建模目的。