代码之家 › 专栏 › 技术社区 › Josh Friedlander

基于包含空值的其他列使用掩码设置值

pandas python

Josh Friedlander · 技术社区 · 6 年前

我想检查某些列(大约5或6),如果所有列都为空,则更改另一个名为 has_nan 从…起 0 1 . 我知道如何过滤/屏蔽,但使用 loc 我感到恐惧 SettingWithCopyWarning .

df = pd.DataFrame([np.random.randint(0,100,3), np.random.randint(0,100,3),
                 np.random.randint(0,100,3), np.random.randint(0,100,3)],
                 columns=['foo', 'bar', 'has_nan'])
for i in ['use_1', 'use_2']:
    df[i] = 2 * ['5'] + 2 * [np.nan]

df.loc[df.use_1.isna() & df.use_2.isna()]['has_nan'] = 'yes'

4 回复 | 直到 6 年前

jpp 5 年前

Avoid chained indexing. 在这里,您可以使用布尔级数:

df['has_nan'] = df[['use_1', 'use_2']].isnull().all(1)

使用布尔级数,即包含 True / False 推荐方法如果你坚持要转换成 'yes' / 'no' 字符串,您可以通过字典映射在后续步骤中执行此操作:

mapper = {1: 'yes', 0: 'no'}
df['has_nan'] = df['has_nan'].map(mapper)

anky 6 年前

你是说这个

df['has_nan'][df['column_name'].isna()] = 0
df['has_nan'][~df['column_name'].isna()] = 1

gosuto 6 年前

尝试 df.loc[df.use_1.isna() & df.use_2.isna(), 'has_nan'] = 'yes' 相反

https://www.dataquest.io/blog/settingwithcopywarning/

Sabih 6 年前

一种方法是:

df['has_nan'][df.use_1.isna() & df.use_2.isna()] = 'yes'

执行以下操作时,它将返回一个副本(这是警告的目的),并且将不起作用:

df.loc[df.use_1.isna() & df.use_2.isna()]['has_nan'] = 'yes'

这两个都会发出警告,您可以使用以下方法使其静音:

pd.set_option('mode.chained_assignment', None)

阅读 Evaluation order matters 详细解释。

推荐文章

July · 如何定义数字间隔,然后四舍五入

1 年前

Community wiki · 对象名称前的单下划线和双下划线的含义是什么?

1 年前

Brian Johnson · 为什么在Python中列出字典列表会引发TypeError?[已关闭]

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

Ashok Shrestha · 需要追踪特定的颜色线并获取坐标

1 年前

Nicote Ool · 在FastApi和Vue3中获得422

1 年前

NeoExceptCodeBad · 如果我有很多垂直线,我如何找到它们的边缘?

1 年前

Abdulaziz · 如何对集合内的列表进行排序[重复]

1 年前

user2743931 · 带有src目录的Python setup.py

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前