1
\ begingroup美元

我一直在通过谷歌BigQuery访问NOAA GSOD的每日历史数据。我感兴趣的是长期的时间序列的雪,降水,并在较小程度上温度为伏尔加盆地周围的地区。

首先,我查看了位于俄罗斯戈罗季茨附近的274530气象站,并注意到数据中有一些奇怪的地方。积雪深度在短时间内会发生显著变化。这似乎不是系统识别的“错误”或“缺乏读取”代码,根据文档和数据,这通常是999。

雪深数据中的一些奇怪之处

(请原谅我的红色涂鸦)。

我不知道如何处理这个数据,它不是“缺失”。我对潜在的物理系统没有很好的理解,但我怀疑雪的水平不会像上图那样突然变化,只是在第二天恢复到类似的水平。

我应该如何解释这些数据,我应该采取什么行动来“清理”它(如果有的话)?最终,我希望对这些数据有信心,这样我就可以将其用于数百个气象站的建模目的。

\ endgroup美元
3.
  • \ begingroup美元 不确定这是否是原因:在原始数据集中,坏值被标记为999。但是,您不能直接访问数据,而是通过另一个服务(谷歌BigQuery)访问数据。因此,如果适当地考虑特殊值,则不能确定。特别是,如果您计算(每月、每年……)平均值,这可能是一个问题。 \ endgroup美元
    - - - - - -daniel.heydebreck
    2017年11月15日11:02
  • \ begingroup美元 www.hoelymoley.com/questions/2911/..。可能不是这里的问题,但您可能想快速浏览一下。 \ endgroup美元
    - - - - - -user967
    2017年11月15日14:25
  • \ begingroup美元 大家好,谢谢你们看这个。我明白雪深数据在没有报告的情况下使用代码999.9,我已经解释清楚了。这些低于预期的值是实际报告的值;我想我想知道读数是否不可靠,人们是否有建模的方法。 \ endgroup美元
    - - - - - -哈米什
    2017年11月16日13:17

0

你的答案

点击“张贴您的答案”,即表示您同意我们的服务条款隐私政策饼干的政策

浏览带标签的其他问题问自己的问题