我有世界上数百个城市的历史降水数据。我想算法确定何时雨季(如果存在)是为每个位置。是否有任何算法可以仅根据月平均值来确定这一点?
我设想的一些问题是:
- 有很多雨是不够的。东南亚的许多地方每天都有几分钟的大雨,但这并不一定被认为是雨季。
- 如果天气比平均降水量高x个标准差,那么它是雨季,还是使用移动平均线?
- 还有其他的想法,链接等等吗?
我是这个领域的新手,所以希望大家能提供帮助和公开讨论。
江南体育网页版地球科学堆栈交换是为那些对地江南电子竞技平台质、气象、海洋学和环境科学感兴趣的人提供的一个问答网站。注册只需要一分钟。
注册加入这个社区这是一个有趣的统计学问题。我会先这么做。取所有年份的数据,计算一年中每天的平均降雨量。如果你在寻找雨天季节,我可能会使用30天移动平均线,但要确保平均线能在1月1日左右结束。一旦你有了这些值——每个站点365个值——我建议你尝试一些事情:
1)尝试标准差法。这很容易计算,所以你应该能够在“高于平均值的x个标准差”中使用特定的数字“x”。如果它对你有效,就没有理由让它变得更难。
2)使用“高于平均值的x标准差”实际上只是意味着你正在寻找降雨的累积分布函数(CDF)的某个值。不用标准偏差,你可以从这365个值中计算出每个站点的CDFs,然后选择第75个百分位数之类的。我仍在思考这是否能够保证你获得一个“季节”;有可能这一年的前百分位值彼此相差甚远。
3)绘制一些关键地点的分布:干燥中纬度、潮湿中纬度、极地、热带(季风为主)。如果这些pdf看起来非常相似,那么您可能能够找到一种明智的方法。
我认为这里的关键问题不是不同的地方总降雨量不同,而是不同的地方有不同的雨季长度.如果一个赛季总是30天,我认为这种方法是好的。我对这些cdf很感兴趣只是想看看它们有什么不同。
让我们知道你想到了什么!
也许你可以尝试傅里叶分析https://en.wikipedia.org/wiki/Fourier_analysis以区分某些模式。已经有论文用这种方法来识别降雨和污染的周期性。例如,周末对城市污染的影响。我现在想不出任何文件,但我相信你能找到一些。
基于以日为单位的湿期持续时间的负二项分布模型,提出了极端降水定义的方法。该模型与实际数据拟合良好,为确定湿期最大日降水量分布和湿期总降水量的渐近逼近提供了理论基础。定义(和确定)极端降水的第一种方法是基于最大日降水量的调质snedecoro - fisher分布。根据这种方法,如果日降水量超过了调和snedecoro - fisher分布的某个(预先定义的)分位数,则被认为是极端的。第二种方法是基于一个湿润期的总降水量具有伽马分布。因此,某一湿润期降水总量极大的假设可以表示为伽马分布样本的均匀性假设。提出了两个等价的检验来检验这一假设。这两个试验都处理了一个湿期的总降水量对连续湿期的考虑集(样本)的相对贡献。在第二种方法中,可以引入相对极端和绝对极端降水量的概念。将这些试验结果应用于实际资料,得出了极端大降水期强度增加的结论。
极端降水量的统计检验通过诉。柯洛维1,A. K. Gorshenin2, K. P. Belyaev3, 2018年11月29日