代码之家 › 专栏 › 技术社区 › mlwh

基于每个唯一id的最新时间戳过滤数据帧[重复]

timestamp dataframe pandas python

mlwh · 技术社区 · 7 年前

标题可能有点混乱,下面是一个示例:

发件人:

id |     timestamp
 1 | 2015-12-02 00:00:00
 1 | 2015-12-03 00:00:00  <--- latest for id 1
 2 | 2015-12-02 00:00:00
 2 | 2015-12-04 00:00:00
 2 | 2015-12-06 00:00:00  <--- latest for id 2

为此:

id |     timestamp
 1 | 2015-12-03 00:00:00
 2 | 2015-12-06 00:00:00

1 回复 | 直到 7 年前

Zero 7 年前

使用 nth

In [599]: df.groupby('id', as_index=False).nth(-1)
Out[599]:
   id            timestamp
1   1  2015-12-03 00:00:00
4   2  2015-12-06 00:00:00

理想的, max 因为你需要最晚的日期。

In [601]: df.groupby('id', as_index=False).max()
Out[601]:
   id            timestamp
0   1  2015-12-03 00:00:00
1   2  2015-12-06 00:00:00

而且 tail 如评论中所述

In [602]: df.groupby('id').tail(1)
Out[602]:
   id            timestamp
1   1  2015-12-03 00:00:00
4   2  2015-12-06 00:00:00

推荐文章

user1245262 · 筛选Pandas数据帧时出现问题

1 年前

Foroand · 熊猫数据帧中的词频计数耗时过长

1 年前

user14696236 · 如何为每个对应的列创建一行[重复]

2 年前

Shawn Hemelstrand · 为什么我的自定义errorbar函数不能在R中工作?

2 年前

Karim Abou El Naga · 将带字符串的DataFrame绘制到堆叠条形图中

2 年前

The Great · 拆分并存储数据帧,但名称基于特定列中的唯一值

2 年前

nickolakis · 基于R中的列名复制列

2 年前

opposity · 形成一个数据帧,该数据帧包含R中包含类别和子类别的列

2 年前

A. Handler · 有没有办法将数据帧的列与完整列名向量相匹配?

2 年前

JasonX · 运行减法计算

2 年前