代码之家 › 专栏 › 技术社区 › conv3d

如何使pd.Grouper()包含空组

pandas python

conv3d · 技术社区 · 7 年前

我有一个数据集,我想按列和数据集中每个月的数据进行分组。我正在使用 pd.Grouper()

df.groupby(['A',pd.Grouper(key='date', freq='M')]).agg({'B':list})

但这只返回每个月的时间 A , B 实际上有数据。我还希望每个月都有没有这方面的数据 , B pd.石斑鱼() 文档

1 回复 | 直到 7 年前

Andy Hayden 7 年前

给定此数据帧:

date        A  B
2018-01-01  1  3
2018-03-01  2  4

在groupby之后,您可以使用重采样,但为了重采样 unfortunately 您需要自己创建多索引:

In [11]: res = df.groupby(['A',pd.Grouper(key='date', freq='M')]).agg({'B':list})

In [12]: m = pd.MultiIndex.from_product([df.A.unique(), pd.date_range(df.date.min(), df.date.max() + pd.offsets.MonthEnd(1), freq='M')])

In [13]: m
Out[13]:
MultiIndex(levels=[[1, 2], [2018-01-31 00:00:00, 2018-02-28 00:00:00, 2018-03-31 00:00:00]],
           labels=[[0, 0, 0, 1, 1, 1], [0, 1, 2, 0, 1, 2]])

In [14]: res.reindex(m)
Out[14]:
                B
1 2018-01-31  [3]
  2018-02-28  NaN
  2018-03-31  NaN
2 2018-01-31  NaN
  2018-02-28  NaN
  2018-03-31  [4]

注意:使用[]填充NA有点棘手,理想情况下您可以解决这个问题(通常不建议在数据框中包含列表)。

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

1 年前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

1 年前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

1 年前

user29715306 · from_users=和chats=电视节目中的差异

1 年前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

1 年前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

1 年前

prayner · 更新嵌套字典包含列表中的项

1 年前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

1 年前

Dave · 如何在for循环中修改列表值

1 年前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

1 年前