代码之家  ›  专栏  ›  技术社区  ›  Jane Sully

样本权重在分类模型中如何工作?

  •  0
  • Jane Sully  · 技术社区  · 6 年前

    为每个样本提供权重意味着什么 分类?像Logistic回归或支持向量机这样的分类算法如何使用权重来强调某些例子?我很想详细解释一下这些算法是如何利用样本权重的。

    如果你看看sklearn documentation for logistic regression ,可以看到fit函数有一个可选的sample_weight参数,该参数定义为分配给各个样本的权重数组。

    1 回复  |  直到 6 年前
        1
  •  3
  •   Frayal    6 年前

    此选项用于不平衡数据集。举个例子:我有很多数据,有些只是噪音。但是其他的对我来说很重要,我希望我的算法比其他的考虑更多。所以我给它分配了一个重量,以确保它得到妥善处理。

    它改变了计算损失的方式。误差(残差)将乘以点的权重,因此,目标函数的最小值将移位。我希望这足够清楚。我不知道你是否熟悉它背后的数学知识,所以我给你提供了一个小的介绍以确定(如果不需要,请道歉) https://perso.telecom-paristech.fr/rgower/pdf/M2_statistique_optimisation/Intro-ML-expanded.pdf