总的来说,三个数据集之间的关系如下:
- 该仿真模型由一组边界条件和初始条件启动,并在长期内提供良好的平均条件。然而,由于模型的内部变异性,根据数据同化频率的不同,短期时间跨度的结果可能会偏离观测值。此外,模型并不完美,有时对某些变量存在偏差。
- 相比之下,卫星数据提供观测数据。这些当然受到技术方面的限制,但正如您提供的链接的第3节中的表格所示,降水测量的质量非常好。然而,卫星的时间/空间分辨率通常比模型差(卫星不可能一次出现在所有地方,根据类型的不同,不能以很高的分辨率进行测量)。
- 再分析是模型模拟和观测的结合,其中两个集合被合并(通过数据同化)以提供一致的数据集。这提供了一个可以被认为是“伪观测”的数据集(它们在气候研究中经常被用作大陆尺度或全球尺度的“观测”数据集),但没有卫星观测的低空间/时间分辨率。重新分析的偏差应该比原来的天气模拟低,但仍然可能存在。
关于温度和降水之间的差异:温度比降水更容易正确模拟(例如,因为干燥/潮湿的过渡)。因此,在月尺度上,降水偏差可能已经相当大了。有关降水偏差的更多信息,本文可能相关:https://agupubs.onlinelibrary.wiley.com/doi/full/10.1029/2010jd014532(Stephens et al.(2010):全球模式降水的沉闷状态)
从本质上讲,您想要使用的数据集应该取决于您的需求。如果空间/时间覆盖和历史数据是最重要的,那么重新分析可能是您的最佳选择。如果你想了解更多关于这个数据集及其偏见的信息,这篇文章是一个很好的起点:https://hess.copernicus.org/articles/24/2527/2020/(Tarek等人(2020):评估ERA5再分析作为北美水文建模的潜在参考数据集)。或者,如果你的目标是影响评估,你可能会立即检查这个:https://essd.copernicus.org/articles/12/2097/2020/(Cucchi et al. (2020): WFDE5:影响研究的偏差调整ERA5再分析数据)