最近,一篇论文发表了方丈和Morahasy (2017)——看到特别图2。论文的论题是训练的人工神经网络(ANN)温度时间序列前工业化时代。然后做预测与安预测温度时间序列在20世纪。因为安训练在工业化前的时间序列,然后我们可以说,工业化是无关紧要的全球变暖。
这是完全相反的IPCC AR5技术总结,显示图形,全球变暖是由于人为原因。见74页的报告。
所以你相信,为什么?
江南体育网页版地球科学堆栈交换是一个问答网江南电子竞技平台站对于那些感兴趣的地质学、气象学、海洋学、环境科学。注册只需要一分钟。
报名加入这个社区最近,一篇论文发表了方丈和Morahasy (2017)——看到特别图2。论文的论题是训练的人工神经网络(ANN)温度时间序列前工业化时代。然后做预测与安预测温度时间序列在20世纪。因为安训练在工业化前的时间序列,然后我们可以说,工业化是无关紧要的全球变暖。
这是完全相反的IPCC AR5技术总结,显示图形,全球变暖是由于人为原因。见74页的报告。
所以你相信,为什么?
纸是有严重缺陷的气候科学和机器学习的观点。最明显的是最引人注目的声称平衡气候敏感性约0.6摄氏度,这如果真的会颠覆我们对气候系统的理解。然而本文实际上并不解释这个图0.6 c从0.2摄氏度的“最大偏差”,它基本上就是一个招招手。最大的偏差也不是0.2,这是最大的平均平均绝对偏差的代理,你可以有一个平均绝对偏差不存在一种趋势,你可以与温室气体浓度增加,因此估计ECS。更重要的是,这将给估计瞬态气候敏感性,而不是平衡气候敏感性,你不能可靠估计ECS(全球)从区域或次区域代理记录。
方法如本文,希望看到多少数据可以归因于“气候周期”与其余被人为组件本质上是偏向低ECS的估计。这是因为变量遗漏偏差;因为人为迫使信号不包含在模型中,如果独立营力变化的净效应是与一个正弦组件,他们会错误地归因于这些气候周期,而事实上它们产生的作用力。这样的模型只能用于估计ECS下界,同样,如果你让一个模型使用推手作为输入,并将剩余作为“自然的变化”往往会高估ECS,给一个上界估计。方丈和Morahasy论文引用了相似纸Loehle,但不幸的是也不引用评论文章(我是第一作者,注意corregendum)。这是可怜的奖学金,可悲的是方丈和Morahasy已经使许多相同的基本错误(但在一个更复杂的模型),这是一种耻辱。
而不是使用原始数据集(其中许多是免费的)作者选择数字化的图像数据集。这似乎有点奇怪,加文·施密特指出通过推特,至少在一个情况下,数据没有被扩展或正确地对齐(andends 1965,不包括最近的变暖,人为贡献最为明显)。它还得知,图5和9都是相同的。
报纸上说“然而,优越的拟合温度得到代理通过使用正弦波组件和复合作为输入数据。这是通过比较光谱分析综合方法建立与ANN方法的训练时间。”。评估性能的训练数据是一个经典的错误的使用机器学习,人们用来制造在1980年代末和90年代,但今天很少见到。如果你有两个嵌套的模型(一个可以实现的一个特例)不同的复杂性,然后更复杂的模型总是训练集误差较低,如果只因为它有更多的记忆数据中的随机噪声的能力,但这并不意味着它是更精确的模型。你需要样本外的比较,缺席。
没有处理的不确定性模型(例如循环组件的时间不清楚,周期与不同周期的研究将解释观测几乎一样),同样会有神经网络的参数的不确定性,但这一切都是通过传播给ECS的估计的不确定性。见Loehle纸上的评论,这可能是实质性的。
表13似乎表明,古气候研究给ECS估计低于全球大气环流模型,这意味着一个选择性的古气候研究中,通常表明ECS IIRC高。
研究也有太多问题研究员自由度(例如选择的特定子集的代理怎么样?)和有很多(自动化)探索模型架构和特征选择,这通常是导致过度学习模型选择。也不清楚为什么观察应该是一个非线性循环变量的函数(尤其是考虑到周期得到的数据通过线性分析)。
天体物理学家Ken大米,“还有物理学”的作者关于气候科学的博客,驳斥了这种特殊的方法除此之外,未能解决的底层物理气候系统:
…如果你要使用类似机器学习对未来进行预测,你需要很有信心,你使用的数据训练系统的机器学习算法提出了一种合理的表示你想模型。这需要一些实际系统的理解。如果你改变它,例如,向大气中排放大量的温室气体,然后训练数据将几乎肯定不合适。
气候研究员加文·施密特在图2中也指出错误:
时间轴是由~ 35年和大小太大了~ 10%。所以他们的“20 C”实际上是1845 - 1965。
这意味着方丈和Morahasy的分析还不包括20世纪末和近几十年来最重要的变暖。
机器学习可能听起来像一些神奇的短语,能够解决所有问题,但二者的不是。我现在没有可用的纸,但是现在我能说一般如下:
机器学习擅长什么,发现模式任意数量的维度。如果你机器学习应用于时间序列(一维数据空间)波动无趣地围绕一个意思是平均水平,就像在前工业化时期,那么它将能够预测的唯一的事就是这一趋势的延续。
此外,安来预测它的训练范围之外的数据相当于用一个非常高阶多项式通过你所有的据点,然后推断未来。前者是数据操作的一个经典例子,也强烈建议在每一个介绍性的物理或统计类。
最后一段,没有严格的证明,表明利用ANN预测趋势在任何类型的数据,不是很聪明,揭示出一个基本的误解安是如何工作的。