代码之家  ›  专栏  ›  技术社区  ›  paolov

检查dataframe列是否具有unicode

  •  0
  • paolov  · 技术社区  · 2 年前

    我想知道,检查pandas dataframe列是否具有unicode和ascii字符串的最简单方法是什么。

    我想试试 df['fieldname'].str.isascii 但这似乎并不存在。

    0 回复  |  直到 2 年前
        1
  •  1
  •   Park    2 年前

    在python3中, str

    你的密码, df['fieldname'].str.isascii ,返回一个序列,该序列包含正确或错误的行。因为您想检查该列是否至少有一个 str 值,您可以进行如下检查:

    import pandas as pd
    
    df = pd.DataFrame(
        {
            'text': [1, 2, '3'], # '3' is str here.
        }
    )
    
    if True in df['text'].apply(lambda x: x.isascii() if isinstance(x, str) else False).to_list():
        print('at least one ascii')
    else:
        print('no ascii')
    # at least one str -> this will be printed because '3' is ascii.