代码之家 › 专栏 › 技术社区 › dark horse

从python数据帧中提取值

pandas python

-2

dark horse · 技术社区 · 6 年前

我有下面的pandas对象,我试图从中提取每个键对应的值。

{'attributes': {'type': 'Contact', 'url': '/services/data/v38.0/sobjects/Contact/0035B00000KRMhZQAX'}, 'Id': '0035B00000KRMhZQAX', 'Name': 'abc xyz', 'Id': 'hello00'}

预期输出:

Id : 0035B00000KRMhZQAX
Name : abc xyz
CustId : hello00

编辑输入值:

{'attributes': {'type': 'Contact', 'url': '/services/data/v38.0/sobjects/Contact/0035B00000KRMhZQAX'}, 'Id': '0035B00000KRMhZQAX', 'Name': 'abc xyz', 'CustId': 'hello00'}

1 回复 | 直到 6 年前

jezrael 6 年前

用途:

df = pd.DataFrame( {'col': {0: {'attributes': {'type': 'Contact', 'url': '/services/data/v38.0/sobjects/Contact/0035B00000KRMhZQAX'},
                                'Id': '0035B00000KRMhZQAX', 'Name': 'abc xyz', 'CustId': 'hello00'}}} )
df.loc[1, 'col'] = 10
df.loc[2, 'col'] = np.nan

print (df)
                                                 col
0  {'attributes': {'type': 'Contact', 'url': '/se...
1                                                 10
2                                                NaN

首先使用字典仅筛选值:

df = df[df['col'].apply(lambda x: isinstance(x, dict))]
print (df)
                                                 col
0  {'attributes': {'type': 'Contact', 'url': '/se...

按键排除,如果键不存在,则添加 None :

df1 = pd.DataFrame([(x.get('Id', None), x.get('Name', None), x.get('CustId', None)) 
                    for x in df['col']], columns=['Id','Name','CustId'])
print (df1)
                   Id     Name   CustId
0  0035B00000KRMhZQAX  abc xyz  hello00

推荐文章

Mainland · Python数据帧规范化值错误:列的长度必须与键相同

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

rpn · 如何在列[1]中连续第二次出现“0”时返回列[0]的值

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前