代码之家 › 专栏 › 技术社区 › mabiel

获取带有NaN的行以及NaN行的前后行

nan pandas

mabiel · 技术社区 · 1 年前

我有一个示例数据帧中的以下片段:

df = pd.DataFrame({'location': ['Seattle', np.nan, 'Portland', 'San Francisco'],
                   'time': ['2022-06-01 12:00:00', '2022-06-01 13:00:00', '2022-06-01 14:00:00', '2022-06-01 15:00:00']})

我想检索location=nan的行以及上面和下面的非nan行。

所以它将是这样

df = pd.DataFrame({'location': ['Seattle', np.nan, 'Portland'], 'time': ['2022-06-01 12:00:00', '2022-06-01 13:00:00', '2022-06-01 14:00:00']})

我怎样才能做到这一点?数据帧比具有不同情况的示例代码段要大。但通常应该是:检索所有带有NaN的行,加上上面或下面的下一个非NaN行。

2 回复 | 直到 1 年前

jezrael 1 年前

使用 boolean indexing 链质量为 | 用于逐位 OR 以下为:

m = df['location'].isna()

df = df[m.shift(fill_value=False) | m.shift(-1, fill_value=False) | m]
print (df)
   location                 time
0   Seattle  2022-06-01 12:00:00
1       NaN  2022-06-01 13:00:00
2  Portland  2022-06-01 14:00:00

mozway 1 年前

我会使用居中 rolling 为生成掩码 boolean indexing 以下为:

N = 1
m = (df['location'].isna()
      .rolling(2*N+1, min_periods=1, center=True)
      .max().eq(1)
     )

out = df.loc[m]

您可以通过更改 N 。

输出:

   location                 time
0   Seattle  2022-06-01 12:00:00
1       NaN  2022-06-01 13:00:00
2  Portland  2022-06-01 14:00:00

推荐文章

LostinSpatialAnalysis · 如何在python中将第二次和后续出现的0设置为NaN

2 年前

Michael Dorner Satyanarayana · 如果无或nan,则合并pandas中的两行

7 年前

Pbalazs89 · NaN问题-无法在Jquery中显示数字

7 年前

Ilya V. Schurov · 在运算符中,浮点(“NaN”)和np。南安

7 年前

Jan · 用熊猫的数据填充矩阵。数据帧,跳过NaN

7 年前

Cedric Zoppolo · 使用ix或iloc检查pandas数据帧中的特定值(单元格中)是否为NaN

7 年前

Jesse · 如果列为NaN并且另一行中该列不是NaN,如何在数据帧中删除行

7 年前

Pythonista anonymous · 熊猫:如何将缺少值的列转换为字符串?

7 年前

user2614596 · scipy。pdist()返回NaN值

7 年前

user7055375 · 如何在ruby中检查var是否为NaN?

7 年前