代码之家  ›  专栏  ›  技术社区  ›  user_01

基于另一列的唯一值的列的和值

  •  0
  • user_01  · 技术社区  · 6 年前

    我有一个数据框

    Column1  Column2
    1          20
    2          25
    3          30
    2          40
    4          18
    1          24
    

    我想根据column1的唯一值对column2求和。我们可以使用以下方法根据特定值(如1)求和:

    df.loc[df['Column1'] == 1, 'Column2'].sum()
    

    准确地说是44。但是我们如何才能对第1列中的所有唯一值执行此操作,从而生成此值

    Column1  Column2
    1          44
    2          65
    3          30
    4          18
    
    1 回复  |  直到 6 年前
        1
  •  7
  •   W Stokvis    6 年前

    我相信你在找 groupby . 你可以找到文件 here

    df.groupby('Column1')['Column2'].sum()
    Column1  Column2
    1          44
    2          65
    3          30
    4          18