1
1
这个
This question
是关于接线员的
另请参见
有人这么说
如果你想的话
间接相关:参见
编辑以答复评论:
我将NA理解为“不可用”(即缺失),而不是“不适用”,这是一个类别。
如果我在数据集A中有一个未知的公寓编号,我会在左连接到数据集B之前小心,因为公寓编号可能在B的一侧已知,然后将不匹配,或者它们将是另一个缺少编号的公寓,我会匹配不属于一起的东西。
但是,如果我匹配一个房子,例如,我可以将数字设置为0作为“不适用”的约定,用于我两个数据集中的所有房子,然后我可以安全地加入,或安全地删除real
如果丢失了
天真的融合:
在我的数据中,每个有猫的人也有狗,现在我弄乱了我的宠物预测模型!
一种选择是进行完全联接以保留所有可用的公寓编号(并在has_dog和has_cat列中创建NAS),然后删除
|
2
1
你要找的是
|
Marc B. · 使用ggplot2创建条形图时“缺少值” 1 年前 |
Mallikarjun M · 如何使用随机森林进行时间序列预测? 1 年前 |
ly li · 模型摘要:当表格形状改变时,拟合优度消失 1 年前 |
RoyBatty · 统计每个字符在整个数据集中出现的次数 2 年前 |
stats_noob · R: 记录某个“行为”发生的循环的索引? 2 年前 |