代码之家  ›  专栏  ›  技术社区  ›  lak3567bo

R logistic回归

  •  0
  • lak3567bo  · 技术社区  · 7 年前

    我对统计和 . 在我的数据集中,目标变量是航班状态,用于预测航班是否可能延迟或准时。因此,它有两个响应变量值-延迟和准时。因此,为了使用 ,我们必须先将目标变量重新编码为0和1吗?我的意思是它需要0-延迟和1-准时吗。或者我可以把目标变量作为因子吗?

    1 回复  |  直到 7 年前
        1
  •  3
  •   Hack-R    7 年前
    data(iris)
    
    Binary dependent variable:
    iris$Species_binary <- ifelse(iris$Species=="setosa", "no", "yes")
    

    它作为一个因素起作用吗?

    glm(as.factor(iris$Species_binary)~iris$Sepal.Length, family="binomial")
    

    是的,确实如此。

    Call:  glm(formula = as.factor(iris$Species_binary) ~ iris$Sepal.Length, 
        family = "binomial")
    
    Coefficients:
          (Intercept)  iris$Sepal.Length  
              -27.829              5.176  
    
    Degrees of Freedom: 149 Total (i.e. Null);  148 Residual
    Null Deviance:        191 
    Residual Deviance: 71.84  AIC: 75.84
    

    它会作为逻辑(布尔)变量工作吗?

    glm(I(iris$Species_binary=="yes")~iris$Sepal.Length, family="binomial")
    
    Call:  glm(formula = I(iris$Species_binary == "yes") ~ iris$Sepal.Length, 
        family = "binomial")
    
    Coefficients:
          (Intercept)  iris$Sepal.Length  
              -27.829              5.176  
    
    Degrees of Freedom: 149 Total (i.e. Null);  148 Residual
    Null Deviance:        191 
    Residual Deviance: 71.84  AIC: 75.84
    

    但是,如果你这样做的话,一定要知道因子的哪一个级别被计算为正级别!否则,你对结果的解释就会倒退。