代码之家  ›  专栏  ›  技术社区  ›  labalala

K-折叠交叉验证/分区模型

  •  0
  • labalala  · 技术社区  · 6 年前

    我有一个包含41个样本和6个预测值的数据集。我用过 树人 对于中的分类树 Matlab 。尽管oob误差很高,但该模型准确预测了所有41个标签。

    但后来我尝试使用k fold交叉验证模型,验证精度仅为41%。我对此感到困惑。

    我的另一个问题是 k-fold算法 在我尝试交叉验证已构建的集成模型时工作。任何帮助都将不胜感激。

    1 回复  |  直到 6 年前
        1
  •  0
  •   Cris Luengo    6 年前

    您不能在同一数据上进行训练和测试。验证毫无意义。

    K-折叠交叉验证是为了防止这种情况。您可以对子集进行训练,并对其余元素进行测试。使用随机子集进行冲洗和重复,以提高验证精度(而不是分类精度)。

    您不能使用k-fold交叉验证测试已经构建的分类器。这完全没有道理。