1
2
我相信你已经知道了这一点,但我只是想确保我涵盖了我的基础——如果D1和D2预测D3,那么使用D1和D3的实际值总是比预测它们更好。 就这个问题而言,我假设D1和D2可能不存在于您的预测数据集中,所以这就是为什么您必须预测它们。从“单词”变量直接预测D3可能更准确,但这超出了本问题的范围。
这只是为了向你展示这个过程。在代码中,您将希望使用更多的单词,并设置您认为最合适的任何选项。 我建议使用坚持样本或交叉验证来衡量绩效。将集成模型与试图通过检查性能基准直接从单词预测D3的单个模型进行比较。 |
Marc B. · 使用ggplot2创建条形图时“缺少值” 1 年前 |
Mallikarjun M · 如何使用随机森林进行时间序列预测? 1 年前 |
ly li · 模型摘要:当表格形状改变时,拟合优度消失 1 年前 |
RoyBatty · 统计每个字符在整个数据集中出现的次数 2 年前 |
stats_noob · R: 记录某个“行为”发生的循环的索引? 2 年前 |