1
\ begingroup美元

我每天都被访问历史通过谷歌BigQuery NOAA GSOD数据。我感兴趣的是长期时间序列的雪,降水、温度和一定程度上的伏尔加盆地周边地区。

最初,我看着气象站274530年,在俄罗斯Gorodets附近,已经注意到,有古怪的数据。积雪深度的变化大大超过一段时间。这似乎并没有一个系统承认“错误”或“缺乏阅读”的代码,根据文档和数据通常是一个999年。

一些奇怪的积雪深度数据

(原谅我红色的波浪线)。

我不知道如何处理这些数据,它不是“失踪”。我没有很好地理解底层的物理系统,但我怀疑雪水平变化突然不像上面的图,只是第二天回复到一个类似的水平。

我该如何解释这些数据,我应该采取什么行动‘干净’(如果有的话)?最终我想对这个数据有信心,这样我就可以用它来在数百个气象站造型的目的。

\ endgroup美元
3
  • \ begingroup美元 不确定这是一个原因:在原始数据集,差值在999年被标记。然而,您访问数据而不是直接通过另一个服务(Google BigQuery)。因此,你无法确定,如果特殊值适当考虑。尤其是,这可能是一个问题如果你计算平均值(月度,年度,……)。 \ endgroup美元
    - - - - - -daniel.heydebreck
    2017年11月15日,11
  • \ begingroup美元 www.hoelymoley.com/questions/2911/…可能不是问题,但是你可能想要快速一瞥。 \ endgroup美元
    - - - - - -user967
    2017年11月15日14章25条的在
  • \ begingroup美元 嗨,伙计们,谢谢你看这个。我知道雪深数据时使用的是999.9的代码没有什么报告,我占了它。这些实际报道值低于预期值;我想我不知道数据是否可靠和周围人的建模方法。 \ endgroup美元
    - - - - - -哈米什
    2017年11月16日,在《在福音》里

0

你的答案

通过点击“发布你的答案”,你同意我们服务条款并承认您已阅读并理解我们的隐私政策的行为准则

浏览其他问题标记问你自己的问题