代码之家  ›  专栏  ›  技术社区  ›  Tinku

二元变量拆分时产生0.5值的决策树

  •  0
  • Tinku  · 技术社区  · 6 年前

    我有很多分类变量,我通过对每个特征进行一次热编码,将它们转换为虚拟变量,并在R中绘制了一棵决策树。我无法理解输出。有人能帮我解释一下,当变量只有0或1时,拆分节点的值是0.5吗。下面是代码和决策树

    mtree <- rpart(Converted~., data = training, method="class",
                   control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 5,
                                           usesurrogate = 2, xval =10 ))
    
    rpart.plot(mtree, # middle graph
               type=4,
               extra=101, 
               box.palette="GnBu",
               branch.lty=3, 
               shadow.col="gray", 
               nn=TRUE,cex = 1
    )
    

    Decision Tree

    例如:对于可变月份June,这是一个热编码的月份,我如何解释月份。六月>=0.5

    0 回复  |  直到 6 年前