代码之家 › 专栏 › 技术社区 › 00schneider

查找至少有一行包含字母的列

pandas python

00schneider · 技术社区 · 5 年前

假设我有以下数据集:

import pandas as pd

df = pd.DataFrame(
        {'A': [1, 2, 3],
         'B': ['one', 2, 3],
         'C': [4, 5, '6Y']
         })

我想知道-没有任何繁琐的for循环-哪些列包含至少一个字母的大小写(这里: B 和 C

谢谢你的帮助!

3 回复 | 直到 5 年前

cs95 abhishek58g 5 年前

作为一个快速而简单的解决方案,您可以使用 replace 和过滤器:

df.replace('(?i)[a-z]', '', regex=True).ne(df).any()

A    False
B     True
C     True
dtype: bool

df.columns[df.replace('(?i)[a-z]', '', regex=True).ne(df).any()]
# Index(['B', 'C'], dtype='object')

str.contains 纵列:

mask = df.astype(str).apply(
    lambda x: x.str.contains(r'[a-z]', flags=re.IGNORECASE)).any()
mask

A    False
B     True
C     True
dtype: bool

df.columns[mask]
# Index(['B', 'C'], dtype='object')

yatu Sayali Sonawane 5 年前

我们可以利用 pd.to_numeric

df.apply(pd.to_numeric, errors='coerce').isna().any().tolist()
# [False, True, True]

applymap 具有 str.isnumeric

(~df.astype(str).applymap(str.isnumeric).all()).tolist()
# [False, True, True]

BENY 5 年前

那样的话你可以 to_numeric

df.apply(pd.to_numeric,errors='coerce').isnull().any()
Out[37]: 
A    False
B     True
C     True
dtype: bool

更新

df.stack().str.contains('[a-zA-Z]').groupby(level=1).any()
Out[62]: 
A    False
B     True
C     True
dtype: bool

推荐文章

Mainland · Python数据帧规范化值错误:列的长度必须与键相同

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

rpn · 如何在列[1]中连续第二次出现“0”时返回列[0]的值

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前

Gtoth · 如何分割Pandas DataFrame中包含多个日期的两个时间戳之间的差异

1 年前

Domarius · 使用loc为多行设置多列值

1 年前

Swastik Bhattacharyya · 如何在同一类别类型的多列上运行get_dummies()函数?

1 年前

DrZoidberg09 · 如何在字典列表中创建一个新关键字,该关键字是另一个关键字的总和?

1 年前

armstrong3701 · 如何有效地处理熊猫数据框中缺失的数据并计算条件统计?

1 年前

msts1906 · 大熊猫向乳胶的适当多品种出口

1 年前