1
4
最简单的方法是只考虑站点级别的分区变量。如果这些站点变量在站点的观测值中不是常数,则可以对每个站点进行平均。例如,对回归器求平均值
如果在观测级别而不是站点级别上有其他变量,则可以将它们(a)包含在公式的回归部分中,以便相应的系数在树中是特定于站点的,
或(b)在公式的随机效应部分,以便仅估计全局系数。例如,如果您有一个观测水平回归器
最后,我们最近发现,在集群级(又名站点级)协变量具有强随机效应的情况下,用随机效应而不是树来初始化模型的估计可能是有意义的。原因很简单,如果我们从树开始估算,那么这将通过集群级变量中的拆分捕获随机截取。我们计划相应地调整方案,但尚未这样做。然而,你自己很容易做到这一点。您只需从仅估计随机截距的空模型开始:
然后提取随机截距并将其包含在数据中:
并将其作为随机效果的起始值:
您可以通过设置
|
Marc B. · 使用ggplot2创建条形图时“缺少值” 1 年前 |
Mallikarjun M · 如何使用随机森林进行时间序列预测? 1 年前 |
ly li · 模型摘要:当表格形状改变时,拟合优度消失 1 年前 |
RoyBatty · 统计每个字符在整个数据集中出现的次数 2 年前 |
stats_noob · R: 记录某个“行为”发生的循环的索引? 2 年前 |