![]() |
1
4
关于缺失数据的一些指导原则。 A、 如果列中缺少超过40%的数据,请删除它!(同样,40%取决于您处理的问题类型!如果数据非常关键或非常微不足道,您可以忽略它)。
B、 检查是否有方法可以从互联网上估算缺失的数据。你看到的是物品重量!如果有的话,你可以知道你正在处理的是哪种产品,而不是散列编码的
MCAR:完全随机缺失。如果数据丢失,这是理想的情况。
E、 除了删除缺失值,用均值或中位数替换外,还有其他高级回归技术可以用来预测缺失值并填充它,例如(小鼠:通过链式方程进行多元插补),您应该浏览并阅读更多关于高级插补技术将有帮助的地方。 |
![]() |
2
0
公认的答案真的很好。
|
![]() |
3
0
“Outlet\u Size”列包含分类数据,因此不要删除数据,而是使用度量填充数据。 由于它是分类数据,使用集中趋势、模式的度量。 代码:
|
![]() |
Pattara · 如何在pandas dataframe中创建列名? 2 年前 |
![]() |
Aptha Gowda · 比较熊猫数据框的列名 6 年前 |
![]() |
Santosh Kashyap · 图像分层抽样 6 年前 |
|
Anx8 · minepy:缓冲区的维度数错误 6 年前 |
![]() |
Ajay Kumar · 如何在数据帧中仅编码分类数据 6 年前 |
|
anka0501 · 如何在数据库中匹配员工职务以简化姓名[已关闭] 7 年前 |