我每天都被访问历史通过谷歌BigQuery NOAA GSOD数据。我感兴趣的是长期时间序列的雪,降水、温度和一定程度上的伏尔加盆地周边地区。
最初,我看着气象站274530年,在俄罗斯Gorodets附近,已经注意到,有古怪的数据。积雪深度的变化大大超过一段时间。这似乎并没有一个系统承认“错误”或“缺乏阅读”的代码,根据文档和数据通常是一个999年。
(原谅我红色的波浪线)。
我不知道如何处理这些数据,它不是“失踪”。我没有很好地理解底层的物理系统,但我怀疑雪水平变化突然不像上面的图,只是第二天回复到一个类似的水平。
我该如何解释这些数据,我应该采取什么行动‘干净’(如果有的话)?最终我想对这个数据有信心,这样我就可以用它来在数百个气象站造型的目的。