收敛交叉映射(CCM)是最近开发的工具,用于回答您提出的问题。它是基于非线性时间序列分析和动力系统理论开发的工具。它允许你:
1)确定两个变量之间是否存在因果关系
2)确立因果关系的方向
3)即使有噪音也要这样做。
至于一个有趣的应用,请看这篇论文气候变化中的因果反馈[van Nes et al., 2015],其中CCM基于Vostok数据集应用于二氧化碳和温度。
编辑:下面我添加了对CCM的更详细的解释,以向原始海报展示这种技术确实回答了他们的问题,以及显示它有严格的数学基础。
收敛交叉映射的一般思想是基于相空间重构[F. Takens, 1981]、[H.阿巴内尔,1996年].数字1到5解释了相空间重构背后的思想,这是理解CCM所必需的。数字6到8非常简单地解释了CCM。为了更深入,参考文献列在底部。
1)由一组方程(如质量守恒、动量守恒等)描述的物理系统具有相空间。方程组的解是通过相空间(或相空间的子集)的轨迹。
2)吸引子是相空间的子集,轨迹/解朝着它发展。
3)如果你知道控制吸引子,那么你就有了系统在任何时候的所有解。
4)图克定理说,人们可以根据一个单一的观察对象重建系统的吸引子。例如,如果温度、压力和速度是系统的三个变量,那么你只需要测量其中一个变量就可以重建系统的吸引子。状态空间重构
5)重构的吸引子并不完全是“真”吸引子,但它与真吸引子有直接的1:1映射。采取定理
6)如果两个观测值属于同一个系统,那么它们都有一个重构的吸引子,直接映射到真实吸引子。重构的吸引子之间也有直接的映射。收敛交叉映射
7)然后可以根据另一个可观察到的重构吸引子对一个可观察到的进行预测,如果它们实际上来自相同的吸引子(因果相关)。时间序列和吸引子
8)最后,用数据进行一系列测试/预测,有助于建立两个变量之间相互作用的方向、强度和线性关系。有关资料详载于有关文件[Sugihara等,2012]和[van Nes et al., 2015].
为了回答你的问题“给定两个观察变量,你如何判断第三个变量是否只是强迫两个观察变量,使它们看起来相关?”首先,相空间重构过程将产生“嵌入维数”的估计,这是对相空间维数(有多少变量)的估计。在CCM框架中,两个已知变量(v1和v2)之间存在单向强迫关系,吸引子v1可以对v2进行熟练的预测,而吸引子v2不能对v1进行熟练的预测。根据你知道第三个变量是什么情况,我认为你可以做的是以下,取v3的重构吸引子并对v1和v2进行预测,并表明v3对v1有更强的预测能力(与v2相比),v3对v2有更强的预测能力(与v1相比)。不过我不太确定。
此外,如果强迫(v3)被认为是线性的,你可以简单地从v1和v2中去除/去趋势v3,就像从温度数据中去除季节性时所做的那样。
注:有MATLAB代码可以随意使用这种技术。我相信你也能在R中找到类似的代码。
参考文献
Sugihara等人,2012,探测复杂生态系统中的因果关系.
van Nes et al., 2015,气候变化中的因果反馈.
阿巴内尔,混沌观测数据分析,1996,施普林格出版。
1981年塔肯斯,在湍流中检测奇怪的吸引子