代码之家 › 专栏 › 技术社区 › Alex

基于其他序列索引从数据帧中选择行

pandas python-3.x python

Alex · 技术社区 · 8 年前

我有一个 DataFrame ,数据框,带 MultiIndex 属于 (id1, id2, date) 还有一堆柱子。我有一个 Series ,S,那是 (id1, id2) 作为索引和 date 作为价值观。我想选择df中的所有行 (ID1,ID2,日期) 匹配S中的相应值。什么是最佳方法?

我想我可以重新设置索引 s 和 df 然后使用列作为连接列来执行右外部 merge .这并不是很好,因为它需要重置散列索引,这样合并比使用列更快。似乎不可能有 系列 没有值(只是索引为 (ID1,ID2,日期) )在这种情况下这是最理想的。还有其他想法吗?

1 回复 | 直到 8 年前

jezrael 8 年前

你可以 merge 按列名称和索引 pandas 0.23.0+ 以下内容:

print (df.merge(s.to_frame(), on=['id1','id2','date']))

样品以下内容:

df = pd.DataFrame({'date':pd.date_range('2015-01-01', periods=6),
                   'id1':[4,5,4,5,5,4],
                   'id2':[7,8,9,4,2,3],
                   'F':list('aaabbb')}).set_index(['id1','id2','date'])

print (df)
                    F
id1 id2 date         
4   7   2015-01-01  a
5   8   2015-01-02  a
4   9   2015-01-03  a
5   4   2015-01-04  b
    2   2015-01-05  b
4   3   2015-01-06  b

s = pd.DataFrame({'date':pd.date_range('2015-01-01', periods=3), 
                  'id1':[4,5,0], 
                  'id2':[7,8,2]}).set_index(['id1','id2'])['date']
print (s)
id1  id2
4    7     2015-01-01
5    8     2015-01-02
0    2     2015-01-03
Name: date, dtype: datetime64[ns]

df1 = df.merge(s.to_frame(), on=['id1','id2','date'])
print (df1)
              date  F
id1 id2              
4   7   2015-01-01  a
5   8   2015-01-02  a

另一个解决方案:

df1 = df.reset_index().merge(s.reset_index(), on=['id1','id2','date'])
print (df1)
   id1  id2       date  F
0    4    7 2015-01-01  a
1    5    8 2015-01-02  a

解决方案 reindex 是可能的,但需要 MultiIndex 锿:

s_index = s.to_frame().assign(tmp=1).set_index('date', append=True).index
idx = df.index.intersection(s_index)
df1 = df.reindex(idx)
print (df1)

                    F
id1 id2 date         
4   7   2015-01-01  a
5   8   2015-01-02  a

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

1 年前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

1 年前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

1 年前

user29715306 · from_users=和chats=电视节目中的差异

1 年前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

1 年前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

1 年前

prayner · 更新嵌套字典包含列表中的项

1 年前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

1 年前

Dave · 如何在for循环中修改列表值

1 年前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

1 年前