代码之家 › 专栏 › 技术社区 › Ashu

在csv文件中使用dataframe交换列-Python

airflow dataframe pandas python-3.x python

Ashu · 技术社区 · 2 年前

我想使用s3 bucket中的dataframe从csv文件交换列。 数据帧 具有具有列名的标题行( sa_instance_state, data_interval_start,NAME )

def modify_csv(**kwargs):
    s3=boto3.client('s3')
    read_file = s3.get_object(Bucket=Bucket, Key=Key)
    df = pd.read_csv(read_file['Body'],sep=',')
    print(df)

输入数据帧 print(df)

sa_instance_state     data_interval_start  NAME 
<sqlalchemy.orm.state.InstanceState1> 2022-07-17 12:55:00+00:00  XYZ
<sqlalchemy.orm.state.InstanceState2> 2022-07-17 12:58:00+00:00  abx

预期结果:

NAME  sa_instance_state     data_interval_start   
XYZ   <sqlalchemy.orm.state.InstanceState1> 2022-07-17 12:55:00+00:00  
abx   <sqlalchemy.orm.state.InstanceState2> 2022-07-17 12:58:00+00:00

2 回复 | 直到 2 年前

Corralien 2 年前

您可以使用 set_index 和 reset_index :

>>> df.set_index('NAME').reset_index()
  NAME                      sa_instance_state        data_interval_start
0  XYZ  <sqlalchemy.orm.state.InstanceState1>  2022-07-17 12:55:00+00:00
1  abx  <sqlalchemy.orm.state.InstanceState2>  2022-07-17 12:58:00+00:00

claraja 2 年前

df = df[['NAME', 'sa_instance_state', 'data_interval_start']]

推荐文章

user1245262 · 筛选Pandas数据帧时出现问题

1 年前

Foroand · 熊猫数据帧中的词频计数耗时过长

1 年前

user14696236 · 如何为每个对应的列创建一行[重复]

2 年前

Shawn Hemelstrand · 为什么我的自定义errorbar函数不能在R中工作?

2 年前

Karim Abou El Naga · 将带字符串的DataFrame绘制到堆叠条形图中

2 年前

The Great · 拆分并存储数据帧,但名称基于特定列中的唯一值

2 年前

nickolakis · 基于R中的列名复制列

2 年前

opposity · 形成一个数据帧,该数据帧包含R中包含类别和子类别的列

2 年前

A. Handler · 有没有办法将数据帧的列与完整列名向量相匹配?

2 年前

JasonX · 运行减法计算

2 年前