我有一个数据框架,包含两列[名称,in.cl]。我想按名称分组,但它是基于连续发生的。例如,考虑下面的数据帧,
在df下生成的代码:
df=pd.DataFrame({'Name':['A','B','B','A','A','B','C','C','C','B','C'],'In.Cl':[2,1,5,2,4,2,3,1,8,5,7]})
输入:
In.Cl Name
0 2 A
1 1 B
2 5 B
3 2 A
4 4 A
5 2 B
6 3 C
7 1 C
8 8 C
9 5 B
10 7 C
我想将它连续重复的行分组。示例组[B](1,2)、[A](3,4)、[C](6,8)等,并在in.cl列中执行求和操作。
预期输出:
In.Cl Name col1 col2
0 2 A A(1) 2
1 1 B B(2) 6
2 5 B B(2) 6
3 2 A A(2) 6
4 4 A A(2) 6
5 2 B B(1) 2
6 3 C C(3) 12
7 1 C C(3) 12
8 8 C C(3) 12
9 5 B B(1) 5
10 7 C C(1) 7
到目前为止,我尝试了复制和Groupby的组合,但效果并不像我预期的那样好。我想我需要一些东西Groupby+连续。但我没有办法解决这个问题。
任何帮助都将不胜感激。