代码之家  ›  专栏  ›  技术社区  ›  Josh Friedlander

在多索引数据帧上建立索引时出现KeyError

  •  -2
  • Josh Friedlander  · 技术社区  · 6 年前

    文档中的以下示例按预期工作:

    s = pd.Series([1, 2, 3, 4, 5, 6],index=pd.MultiIndex.from_product([["A", "B"], ["c", "d", "e"]]))
    
    s['A']
    
    c    1
    d    2
    e    3
    

    但是,在本例中,从我的数据来看,这样的索引会引发一个错误:

    df = pd.DataFrame({'client_id': {('foo', '2018-01-29'): '1',
      ('bar', '2018-01-29'): '1',
      ('baz', '2018-01-29'): '1',
      ('alice', '2018-01-29'): '1',
      ('bob', '2018-01-29'): '1'}})
    
    df['alice']
    
    KeyError: 'alice'
    

    1 回复  |  直到 6 年前
        1
  •  1
  •   cs95 abhishek58g    6 年前

    只用 loc

    df.loc['alice']
    
               client_id
    2018-01-29         1
    

    df . 有了这一系列,我们显然需要 __getitem__ 正在访问索引。


    其他备选方案(根据 How do I slice or filter MultiIndex DataFrame levels? ):

    df.loc(axis=0)['alice']
    
               client_id
    2018-01-29         1
    

    df.xs('alice')
    
               client_id
    2018-01-29         1
    

    df.query('ilevel_0 == "alice"')
    
                     client_id
    alice 2018-01-29         1