代码之家  ›  专栏  ›  技术社区  ›  Jane Sully

解释sklearn中的逻辑回归特征系数值

  •  2
  • Jane Sully  · 技术社区  · 6 年前

    我已经为我的数据建立了一个逻辑回归模型。假设我有四个特点:受试者接受的条件、受试者对被测现象是否有任何先前的知识/背景(实验后问卷中的二元反应)、实验任务花费的时间和受试者年龄。我试图预测参与者是否最终选择了选项A或选项B。我的逻辑回归输出以下特征系数 clf.coef_ 以下内容:

    [-0.68120795-0.19073737-2.50511774 0.14956844]]

    如果选项A是我的正类,那么这个输出是否意味着功能3是二进制分类最重要的功能,并且与选择选项A的参与者有负关系(注意:我没有规范化/重新缩放我的数据)?我想确保我对系数的理解,以及从中提取的信息是正确的,所以我在分析中不做任何归纳或错误的假设。

    谢谢你的帮助!

    1 回复  |  直到 6 年前
        1
  •  1
  •   rocksteady    6 年前

    你走对了。如果一切都是一个非常相似的量级,一个更大的pos/neg系数意味着更大的效果,所有的东西都是相等的。

    但是,如果您的数据没有经过标准化,Marat是正确的,因为系数的大小没有任何意义(没有上下文)。例如,您可以通过将度量单位更改为更大或更小来获得不同的系数。

    我看不出这里是否包含了非零截距,但请记住,逻辑回归系数实际上是优势比,您需要将其转换为概率,以获得更直接的解释。

    请查看此页面以获得良好的解释: https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-how-do-i-interpret-odds-ratios-in-logistic-regression/