1
4
我认为答案取决于你的特征。 用填充缺少的数据 expectation maximization (EM)
更正式一点说,如果你在性别列中有一个缺失值,但你有一个工资值,EM告诉你P(性别=男性|工资=w0,θ),即在给定工资=w0和θ的情况下,性别为男性的概率,θ是通过最大似然估计获得的参数。 更简单地说,这可以通过运行性别对工资的回归(使用逻辑回归,因为y变量是分类的)来实现,从而为您提供上述概率。 视觉上:
(这些完全是附加值,但传达了男性工资分配通常高于女性的想法)
不要归咎于 如果这两个特征之间没有关系,并且您认为丢失的数据可能不是随机丢失的。 |
Bushra Jabeen · 计算列中的互信息 2 年前 |
rkraaijveld · sklearn的Coef。线性回归为无 2 年前 |
Sherwin R · 随机森林预测错误的输出形状 2 年前 |
Gijo george · 如何识别段落中每个句子的情绪 2 年前 |
Test · 安装Scikit Learn Big Sur M1 2 年前 |
Rich · 我可以简化零系数的Lasso Lars运行时吗? 2 年前 |
Medo · 是否可以将3D图像转换为一个矢量? 6 年前 |