3
\ begingroup美元

我有一个大的数据集包含近十年的颗粒物测量。在测量仪器的精度下限,有值给出< 8。然而,对于统计分析定义的值是必要的。

什么是最好的方式来处理这个问题?

  • 作为缺失值替换它呢?
  • 取代它8甚至7(< 8)?
  • 假设0吗?
  • 假设像之间的平均值08;e . g。4吗?

或者有没有更好的解决方案,考虑到自然背景值?

编辑:我想计算盘中intra-year分布,以及寻找模式通过考虑风directiond和速度。

\ endgroup美元
6
  • 1
    \ begingroup美元 这取决于你想测量/计算。所以我们需要更多的信息。 \ endgroup美元
    - - - - - -Jan Doggen
    2016年10月3日10:05
  • \ begingroup美元 @JanDoggen:添加一些更多的信息,谢谢! \ endgroup美元
    - - - - - -阿恩
    在2016年10月3日
  • 1
    \ begingroup美元 也许一个标准差的限制的决心就足够了,但这取决于您所使用的数据集的范围,和准确性/无论你正试图分析精度。如果限制的决心,说7或8,高频率相对于其他值,那么你可能有一个统计问题从统一的下限,在这种情况下,counter-inuitively,可能有利于合成随机性引入你的最小值。我有时这样做当我不得不合成失踪的降雨数据。 \ endgroup美元
    - - - - - -戈登斯坦格
    2016年10月3日13:03
  • \ begingroup美元 除了戈登斯坦格的评论:更换< 8价值观缺失的值可能会改变分布但取代< 8由噪声值(或其他non-missing取代它的值)可能产生人工相关性。因此,它可能是合理的噪音和缺失值的方法,得到一种感觉哪一个是更好的工作。如果有小于约5%(不是固定阈值)我建议用缺失值。 \ endgroup美元
    - - - - - -daniel.heydebreck
    2016年10月4日7点45
  • \ begingroup美元 也许考虑改变你的问题的标题。看标题,我认为将专注于编程相关的问题。 \ endgroup美元
    - - - - - -daniel.heydebreck
    2016年10月4日早上7。48分

0

你的答案

通过点击“发布你的答案”,你同意我们服务条款并承认您已阅读并理解我们的隐私政策的行为准则

浏览其他问题标记问你自己的问题