![]() |
1
60
调整后的r平方中的“调整”与变量数量和观测数量有关。 如果你不断地在你的模型中添加变量(预测因子),r平方将会改进——也就是说,预测因子会解释方差——但其中一些改进可能仅仅是由于偶然性。因此,调整后的r平方试图通过考虑比率(n-1)/(n-k-1),其中n=观察数,k=变量数(预测数),来纠正这一点。 在您的案例中,这可能不是一个问题,因为您有一个单一的变量。 一些参考文献: |
![]() |
2
8
调整后的r平方接近但不同于r2的值。它不是基于解释的平方和ssr和平方和ssy的总和,而是基于总体方差(我们通常不计算的一个量),s2t=ssy/(n-1)和误差方差mse(来自方差分析表),计算如下:调整后的r平方=(s2t-mse)/s2t。 这种方法为判断由于添加了解释变量而导致的拟合改进提供了更好的基础,但它没有R2所具有的简单的汇总解释。 如果我没有犯错误,您应该按照以下方式验证调整后的r平方和r平方的值:
另一方面,r2为:ssr/ssy,其中ssr=ssy-sse
|
![]() |
3
6
R平方与模型中变量的数量无关。调整后的r平方为。 调整后的r平方加上了一个惩罚,即向模型中添加与您试图解释的变量不相关的变量。您可以使用它来测试变量是否与您试图解释的内容相关。 调整后的r平方是r平方,加上一些除法,使其依赖于模型中变量的数量。 |
![]() |
4
2
注意,除了预测变量的数量外,上面调整后的r平方公式也会根据样本大小进行调整。一个小样本会得到一个大的r平方。 实验教育69(2):203-224,“多元回归中R平方收缩的估计”,Ping Yin&Sitao Fan,J.比较了调整R平方的不同方法,得出上述常用方法不好的结论。他们推荐Olkin&Pratt配方。 然而,我已经看到一些迹象表明人口规模的影响比这些公式中的任何一个都要大得多。我不相信这些公式中的任何一个都足以让你比较不同样本量的回归(例如,2000个样本与200000个样本;标准公式几乎没有基于样本量的调整)。我会做一些交叉验证来检查每个样本的r平方。 |
|
Marc B. · 使用ggplot2创建条形图时“缺少值” 1 年前 |
|
Mallikarjun M · 如何使用随机森林进行时间序列预测? 1 年前 |
|
ly li · 模型摘要:当表格形状改变时,拟合优度消失 1 年前 |
![]() |
RoyBatty · 统计每个字符在整个数据集中出现的次数 2 年前 |
![]() |
stats_noob · R: 记录某个“行为”发生的循环的索引? 2 年前 |