代码之家  ›  专栏  ›  技术社区  ›  Guillermo Herrera

在决策树上设置阈值?

  •  0
  • Guillermo Herrera  · 技术社区  · 7 年前

    setThresholds() Apache Spark中梯度增强树和随机森林的函数?Apache Spark官方网站中没有使用该功能的文档或示例,我很好奇是否可以将其用于我的特定用途。该函数是否对树的内部决策设置阈值?例如,对于数字列,使用 setThresholds(5.0) 相当于 if(column < 5.0)

    1 回复  |  直到 7 年前
        1
  •  2
  •   eliasah    7 年前

    你似乎没有检查正确的部分 documentation .

    这个 thresholds 值定义如下:

    Param用于多类分类中的阈值,以调整预测每个类的概率。数组的长度必须等于类的数量,其值为>=预测p/t值最大的类别,其中p是该类别的原始概率,t是类别的阈值。

    你已经注意到这实际上是 阈值 复数形式,而不仅仅是一个阈值。

    setThresholds(foo) 哪里 foo