7
\ begingroup美元

线性相关(Pearson’s)在气象学/气候学中被广泛应用于评估的关系例如,两个变量之间的差异,例如降水和海温。

然而,我们知道这一点相关性并不一定意味着因果关系,主要有两个因素:可能有外部因素作用于两个系列或虚假的巧合也可能发生。

在地球科学(气象学、海洋学、气象学……)中,有哪些可能的、可理解的方法被使用过,并且有可能被重现,以进一步说明这种相关性江南体育网页版在某些情况下暗示因果关系?

编辑使其更具体:

想象一下,某些地区的海表温度(SST)与另一地区的降雨量之间存在相关性。如何测试两个系列的可变性是否不是由第三方外力造成的?

谢谢你!

\ endgroup美元
7
  • 1
    \ begingroup美元 如果你问的是如何证明因果关系(我认为这是一个模糊的主题),那真的是一个数学SE问题。地球科学中的例子可能会使江南体育网页版用相同的方法....问你要名单是不是有点太开放了? \ endgroup美元
    - - - - - -JeopardyTempest
    2017年7月1日16:50
  • 4
    \ begingroup美元 太宽……问题必须是关于一个特定的地球科学问题。江南体育网页版我自己也因为同样的原因解决过几个问题。 \ endgroup美元
    - - - - - -f.thorpe
    2017年7月1日17:00
  • 1
    \ begingroup美元 就气象学相关主题而言,我认为许多统计研究更多地基于确定关系,而不是证明明确的因果关系。发现剪切和CAPE剖面有利于龙卷风,设置表明暴雨等…重要的是能够发现这样的事件,而不是推理。显然,并不是所有的主题都是这样,但确实很多。除此之外,观察相关性研究通常与动态研究协同工作,探索实际机制以进一步巩固和理解(加上寻求理想化证据的模型研究) \ endgroup美元
    - - - - - -JeopardyTempest
    2017年7月1日18:12
  • 1
    \ begingroup美元 但在相关性/因果关系的话题中,有一个话题肯定会受到更多的关注,那就是全球变暖,所以也许把这个问题缩小到这个范围会让它更可行。 \ endgroup美元
    - - - - - -JeopardyTempest
    2017年7月1日18:14
  • 1
    \ begingroup美元 @BarryCarter谢谢,是的,小型物理模型允许这一点,但是关于气候系统有点困难。 \ endgroup美元
    - - - - - -
    2017年7月2日7点47分

3答案3.

5
\ begingroup美元

收敛交叉映射(CCM)是最近开发的工具,用于回答您提出的问题。它是基于非线性时间序列分析和动力系统理论开发的工具。它允许你:
1)确定两个变量之间是否存在因果关系
2)确立因果关系的方向
3)即使有噪音也要这样做。

至于一个有趣的应用,请看这篇论文气候变化中的因果反馈van Nes et al., 2015],其中CCM基于Vostok数据集应用于二氧化碳和温度。

编辑:下面我添加了对CCM的更详细的解释,以向原始海报展示这种技术确实回答了他们的问题,以及显示它有严格的数学基础。

收敛交叉映射的一般思想是基于相空间重构[F. Takens, 1981]、[H.阿巴内尔,1996年].数字1到5解释了相空间重构背后的思想,这是理解CCM所必需的。数字6到8非常简单地解释了CCM。为了更深入,参考文献列在底部。

1)由一组方程(如质量守恒、动量守恒等)描述的物理系统具有相空间。方程组的解是通过相空间(或相空间的子集)的轨迹。

2)吸引子是相空间的子集,轨迹/解朝着它发展。

3)如果你知道控制吸引子,那么你就有了系统在任何时候的所有解。

4)图克定理说,人们可以根据一个单一的观察对象重建系统的吸引子。例如,如果温度、压力和速度是系统的三个变量,那么你只需要测量其中一个变量就可以重建系统的吸引子。状态空间重构

5)重构的吸引子并不完全是“真”吸引子,但它与真吸引子有直接的1:1映射。采取定理

6)如果两个观测值属于同一个系统,那么它们都有一个重构的吸引子,直接映射到真实吸引子。重构的吸引子之间也有直接的映射。收敛交叉映射

7)然后可以根据另一个可观察到的重构吸引子对一个可观察到的进行预测,如果它们实际上来自相同的吸引子(因果相关)。时间序列和吸引子

8)最后,用数据进行一系列测试/预测,有助于建立两个变量之间相互作用的方向、强度和线性关系。有关资料详载于有关文件[Sugihara等,2012]和[van Nes et al., 2015].

为了回答你的问题“给定两个观察变量,你如何判断第三个变量是否只是强迫两个观察变量,使它们看起来相关?”首先,相空间重构过程将产生“嵌入维数”的估计,这是对相空间维数(有多少变量)的估计。在CCM框架中,两个已知变量(v1和v2)之间存在单向强迫关系,吸引子v1可以对v2进行熟练的预测,而吸引子v2不能对v1进行熟练的预测。根据你知道第三个变量是什么情况,我认为你可以做的是以下,取v3的重构吸引子并对v1和v2进行预测,并表明v3对v1有更强的预测能力(与v2相比),v3对v2有更强的预测能力(与v1相比)。不过我不太确定。

此外,如果强迫(v3)被认为是线性的,你可以简单地从v1和v2中去除/去趋势v3,就像从温度数据中去除季节性时所做的那样。

注:有MATLAB代码可以随意使用这种技术。我相信你也能在R中找到类似的代码。

参考文献

Sugihara等人,2012,探测复杂生态系统中的因果关系
van Nes et al., 2015,气候变化中的因果反馈
阿巴内尔,混沌观测数据分析,1996,施普林格出版。
1981年塔肯斯,在湍流中检测奇怪的吸引子

\ endgroup美元
9
  • 1
    \ begingroup美元 你为什么这么想?数学领域的动力系统理论表明你可以。为了清晰起见,我将在文章中添加一段编辑来解释这个过程。 \ endgroup美元
    - - - - - -Z W
    2017年7月2日19:46
  • 1
    \ begingroup美元 @BarryCarter根据你的评论,我引用了数学基础。 \ endgroup美元
    - - - - - -Z W
    2017年7月2日20:58
  • 1
    \ begingroup美元 @ouranos我更详细地添加了一种严格的方法,可以用于确定两个可观测数据之间的因果关系,而不仅仅是统计相关测量,即基于系统动力学的方法(但不了解控制方程)。至于你的海表温度和降雨的具体例子,你可以很容易地使用这种方法-见参考文献气候变化中的因果反馈在美国,你可以完全按照他们的方法,用海温代替温度,用降雨量代替二氧化碳。 \ endgroup美元
    - - - - - -Z W
    2017年7月2日20:59
  • 1
    \ begingroup美元 @BarryCarter,所以实际上CCM算法在一定程度上是对格兰杰因果关系(为随机变量设计)局限性的回应。 \ endgroup美元
    - - - - - -Z W
    2017年7月3日5:49
  • 1
    \ begingroup美元 @ouranos深潜问一个深刻的问题!这里有一些matlab代码的链接mathworks.com/matlabcentral/fileexchange/..。此外,还有一个关于该技术的很好的讨论,以一种不太正式/更容易理解的风格,并链接到更多的matlab代码askhamwhat.github.io /博客/ 2016/03/09 / detecting-causality最后,你可能会注意到一些应用是生态的,但这并不重要,重要的是所讨论的系统有一组相关的微分方程来描述它(即一个动力系统) \ endgroup美元
    - - - - - -Z W
    2017年7月5日20:43
4
\ begingroup美元

我可以举一些大气科学的例子:

  1. 垂直方向上的风和温度:随着高度的增加,由于地球势能守恒,温度会降低。此外,由于缺乏摩擦,风速也会增加。

  2. 在数据同化中,伪相关是很常见的,特别是对于大距离的数据。局部化是减少伪相关影响的一种方法。

  3. 降水与低压有关,这不是一个不寻常的经验法则。然而,这一经验法则并不总是适用于雷暴,在雷暴中,压力可能会在下沉气流中增加。

  4. 众所周知,压力和温度成正比($P=\rho R T$)。然而,如果你看一下飓风的数据,暖空气可以加强飓风风引起的表面热交换.此外,暖平流也可以降低温带气旋的压力。

  5. 虚假的相关性有一份相关性的例子清单,这些相关性不是很多时候都是无法解释的,尽管不是所有的都被归入地球科学。江南体育网页版例如,南卡罗来纳州的降水与威斯康辛州里奇兰县的降水呈负相关(-0.77)。

\ endgroup美元
5
  • \ begingroup美元 在#2中,大气中存在显着的联系,比如ENSO对全球几乎所有地方的影响,PNA, PSA……在第4条中,我认为这个规则适用于一个封闭系统,想象一个P和T成比例的密封盒子。在开放的环境中,我可以直观地想到温度升高导致密度降低,空气膨胀,因此压力降低。 \ endgroup美元
    - - - - - -
    2017年7月2日7点33分
  • \ begingroup美元 厄尔尼诺滞后IOD两个季节。这是否意味着IOD导致了厄尔尼诺现象?正IOD通常伴随拉尼娜现象,负IOD通常伴随厄尔尼诺现象。相关性导致因果关系? \ endgroup美元
    - - - - - -gansub
    2017年7月2日14:34
  • \ begingroup美元 @Ouranos虽然由于遥相关,确实存在一些相关性,但通常这些相关性不会用于数据同化。否则,你可以推断,在阿根廷的观察可以告诉你格陵兰岛的天气。此外,许多遥相关并不是直接的,如ENSO、NAO等。它们被气候学标准化。 \ endgroup美元
    - - - - - -BarocliniCplusplus
    2017年7月2日18:10
  • \ begingroup美元 @gansub在ouranos提出之前,我从未真正谈论过遥相关。我不太了解IOD,但我会回答这个关于EnKF的问题。EnKF不使用时间滞后来计算观测值,而是使用集成扩散和观测局部性来同化数据。4D杂交模型并非如此,但建模研究通常是次季节性的。想想3英里外的观测结果在500英里外的代表性有多大。这实际上就是我们所考虑的。 \ endgroup美元
    - - - - - -BarocliniCplusplus
    2017年7月2日18:29
  • 1
    \ begingroup美元 @BarocliniCplusplus我对数据同化不太了解,抱歉没有注意到具体的背景。我只是想强调,尽管距离很远,但因果关系可能存在。 \ endgroup美元
    - - - - - -
    2017年7月2日21:13
3.
\ begingroup美元

作为收敛交叉映射(CCM)的替代方案,最近Tigramite是一个快速的python库因果发现,承诺…

...在检测能力方面优于当前的方法,并可扩展到高维数据集。它克服了检测偏差,特别是当存在强自相关性时,并允许在大规模分析中根据因果强度对关联进行排名。

本文介绍了该方法在大气和气候数据集上的实际应用:

龙格,雅各布,迪诺·塞吉迪诺维奇,还有赛斯·弗拉克斯曼。在大型非线性时间序列数据集中检测因果关联。arXiv:1702.07007[物理,统计],2017年2月22日。http://arxiv.org/abs/1702.07007。

乍一看,与CCM的区别是:

  • CCM是一种确定性方法,用于检验时间序列是否与同一假设吸引子相关,而Tigramite检验用于检验时延之间的统计相关性。
  • CCM是一种成对的方法,而Tigramite更快,更容易应用于更大的数据库。

这些可能是互补的。

\ endgroup美元

    你的答案

    点击“张贴您的答案”,即表示您同意我们的服务条款隐私政策而且饼干的政策

    这不是你想要的答案?浏览带标签的其他问题问自己的问题