1
4
这种方法很简单 影响编码 分类变量。 如果您的分类列具有类别{C1、C2、C3、…},然后按如下方式进行碰撞编码:
在训练期间,对于每个类别(Ci),它计算平均输出(给定该类别,即后验概率)与因变量的总体期望值(先验)之间的差值。有关影响编码的更多参考,请参阅本文 https://arxiv.org/abs/1611.09477v3 (第10页) 在测试阶段,为了将测试数据的分类变量转换为其影响代码,它使用了与训练数据相同的预期值“y”。因为这是一个期望值,所以训练数据的样本数是否比测试数据多并不重要(只要“y”在两个数据集中的分布相似)。 |
July · 如何定义数字间隔,然后四舍五入 1 年前 |
user026 · 如何根据特定窗口的平均值(行数)创建新列? 1 年前 |
Ashok Shrestha · 需要追踪特定的颜色线并获取坐标 1 年前 |
Nicote Ool · 在FastApi和Vue3中获得422 1 年前 |
Abdulaziz · 如何对集合内的列表进行排序[重复] 1 年前 |
asmgx · 为什么合并数据帧不能按照python中的预期方式工作 1 年前 |