我有历史沉淀全世界数百个城市的数据。我想通过算法确定雨季(如果存在)时为每个位置。有什么算法,可以确定这仅根据每月平均吗?
一些问题,我的设想是:
- 有很多雨是不够的。东南亚许多地方有很大雨一天爱上了几分钟,但它仍然不一定被认为是雨季。
- 更好地说,如果天气是x标准差以上平均降水是雨季或使用移动平均线?
- 任何其他想法,链接,等等?
我全新的领域帮助和一个开放的讨论,我们将不胜感激。
江南体育网页版地球科学堆栈交换是一个问答网江南电子竞技平台站对于那些感兴趣的地质学、气象学、海洋学、环境科学。注册只需要一分钟。
报名加入这个社区这是一个有趣的统计问题。我会首先做这件事。把所有的年的数据和计算每天的平均降雨量。如果你正在寻找雨中季节,我会用一个30天的移动平均线,但确保平均可以环绕1月1。一旦你有了这些值为每个站点——365值——我建议尝试几件事:
1)尝试标准差的方法。很容易计算,所以您应该能够玩转这些特定的数字“x”“x个标准差”。如果它适合你,没有理由让它更加困难。
2)使用“x个标准差”只是意味着你正在寻找一个累积分布函数的某些价值(CDF)的降雨量。而不是使用标准偏差,可以计算这些CDFs每个站点的365值,并选择第75百分位什么的。我还在思考这是否会保证你得到一个“季节”;有可能今年最富价值的相互接近。
3)划分几个发行版主要网站:干情理之中,湿情理之中,极地,热带地区(monsoon-dominated)。如果这些pdf文档看起来非常相似,你可以找出一种合理的方法。
我想这里的关键困难不会,不同的地方有不同的总降雨量,但不同的地方可以有不同的雨季长度。如果本赛季一直是30天,我认为这种方法会没事的。我很感兴趣看到那些CDFs看看他们是多么不同。
让我们知道你想出!
也许你可以试着傅里叶分析-https://en.wikipedia.org/wiki/Fourier_analysis区分特定的模式。有论文使用这种方法来识别周期性降雨和污染。例如,周末对城市污染的影响。我现在想不出任何文件,但我相信你可以找到一些。
方法,基于持续时间的分布的负二项模型湿时间以天,提出了极端降水的定义。这个模型展示了优秀的符合真实数据和提供了一个理论基础的决心渐近近似分布的最大程度上的每日在湿内沉淀体积以及降水总量在潮湿的时期。第一种方法的定义(和决心)极端降水是基于调和Snedecor-Fisher最大程度上的每日降水的分布。根据这种方法,每天沉淀体积被认为是极端,如果超过一定(预定义的)分位数的回火Snedecor-Fisher分布。第二种方法是基于降水总量湿段的伽马分布。因此,假设某湿期间降水总量非常大可以制定为样本的同质性假设γ分布。两个等效测试提出了测试这个假说。这两个测试处理降水总量的相对贡献湿一段连续的考虑设置(样本)湿期。在第二种方法可以引入的概念相对和绝对极端降水卷。应用这些测试的结果,提出了真实数据产生的结论体积湿期极端大降水的强度增加。
极端降水的统计测试卷通过诉。Korolev1, a . k . Gorshenin2 k . p . Belyaev3, 2018年11月29日