代码之家  ›  专栏  ›  技术社区  ›  Xiaoyu Lu

套索中一个热编码的分类变量,如何比较变量的重要性?

  •  2
  • Xiaoyu Lu  · 技术社区  · 6 年前

    我在做一个回归项目 sklearn 我用套索回归分析了各种数值和分类变量。分类变量采用单热编码方法进行转换。

    Feature         Coefficient
    sqft             114.35
    type_house       67.11
    type_apartment   -23.97
    type_condo       5.14
    

    什么是比较sqft和type重要性的合理方法?

    1 回复  |  直到 6 年前
        1
  •  1
  •   An economist    6 年前

    LASSO y-axis 和λ开启 x-axis 随着规则化惩罚的增加,重要性发生了变化

    Here 你会找到更详细的描述(图片来源)。你能看到的是, wt 是最重要的变量之一,因为即使 罚款(λ) 不同于零

    Variable importance and lambda