我有一个关于卡方检验的简单问题(不幸的是,我在大学时只有极端的数学基础)。我的研究结果如下:
我想我会用旧数据作为预期频率,用新数据作为观测频率。我的结果如下。
id New old Chisquare 0 (-26, -22] 17858.0 31704.0 10735.340800 1 (-22, -18] 16060.0 18990.0 534.551681 2 (-18, -14] 20023.0 13964.0 1833.465565 3 (-14, -10] 19845.0 5573.0 10264.045553 4 (-10, -6] 12757.0 779.0 11246.569256 5 (-6, -2] 6446.0 0.0 6446.000000 6 (-2, 2] 1391.0 0.0 1391.000000 Total 94380.0 71010.0 42450.972855
如何计算p值?我有4行自由!我使用python代码:
1 - stats.chi2.cdf((total(Chi^2)), 4)
但我的结果是:
>>> 1 - stats.chi2.cdf(42450.972855,4) 0.0
所以我想问这是否正确,尽管数据的变化可以在图中识别。