代码之家 › 专栏 › 技术社区 › Hatshepsut

在pandas多索引中分配列

multi-index pandas python

Hatshepsut · 技术社区 · 6 年前

我有这个数据框:

                mu_post          
z                     c         t
index a   b                      
0     0.0 0.0  0.042824  0.051212
      0.5 0.5  0.048293  0.058130
      1.0 1.0  0.047267  0.074043
1     0.0 0.0  0.058205  0.054106
      0.5 0.5  0.064153  0.063573
      1.0 1.0  0.056918  0.059572
2     0.0 0.0  0.059032  0.052211
      0.5 0.5  0.070616  0.066792
      1.0 1.0  0.056892  0.045061

制作单位:

import pandas as pd
df = pd.DataFrame({('mu_post', 'c'): {(0, 0.0, 0.0): 0.042824223871028126, (0, 0.5, 0.5): 0.04829260822563669, (0, 1.0, 1.0): 0.047267365970316805, (1, 0.0, 0.0): 0.05820509767743391, (1, 0.5, 0.5): 0.06415323721481726, (1, 1.0, 1.0): 0.0569177959009184, (2, 0.0, 0.0): 0.05903204294019807, (2, 0.5, 0.5): 0.07061613725719014, (2, 1.0, 1.0): 0.056892088025082874}, ('mu_post', 't'): {(0, 0.0, 0.0): 0.051212446939110846, (0, 0.5, 0.5): 0.058129980845875964, (0, 1.0, 1.0): 0.07404310411549644, (1, 0.0, 0.0): 0.05410577324029455, (1, 0.5, 0.5): 0.06357338131851693, (1, 1.0, 1.0): 0.0595723832219094, (2, 0.0, 0.0): 0.05221119083827467, (2, 0.5, 0.5): 0.06679207329135116, (2, 1.0, 1.0): 0.04506069626935631}})

我想补充 odds 是的。

def odds(p):
    return p / (1-p)

我可以这样分配:

df.assign(
        odds_c=lambda x: odds(x[('mu_post', 'c')]),
        odds_t=lambda x: odds(x[('mu_post', 't')]),
)

             mu_post              odds_c    odds_t
                   c         t                    
 0 0.0 0.0  0.042824  0.051212  0.044740  0.053977
   0.5 0.5  0.048293  0.058130  0.050743  0.061718
   1.0 1.0  0.047267  0.074043  0.049612  0.079964
 1 0.0 0.0  0.058205  0.054106  0.061802  0.057201
   0.5 0.5  0.064153  0.063573  0.068551  0.067889
   1.0 1.0  0.056918  0.059572  0.060353  0.063346
 2 0.0 0.0  0.059032  0.052211  0.062735  0.055087
   0.5 0.5  0.070616  0.066792  0.075982  0.071573
   1.0 1.0  0.056892  0.045061  0.060324  0.047187

但我真正想要的是列多索引 [(mu_post, c), (mu_post, t), (odds, c), (odds, t)]

如果可能的话,我想将链接方法的pipe/apply/assign样式一起使用。

2 回复 | 直到 6 年前

DSM 6 年前

您可以加入/应用/重命名:

In [188]: df.join(df.apply(odds).rename(columns={"mu_post": "odds"}))
Out[188]: 
            mu_post                odds          
                  c         t         c         t
0 0.0 0.0  0.042824  0.051212  0.044740  0.053977
  0.5 0.5  0.048293  0.058130  0.050743  0.061718
  1.0 1.0  0.047267  0.074043  0.049612  0.079964
1 0.0 0.0  0.058205  0.054106  0.061802  0.057201
  0.5 0.5  0.064153  0.063573  0.068551  0.067889
  1.0 1.0  0.056918  0.059572  0.060353  0.063346
2 0.0 0.0  0.059032  0.052211  0.062735  0.055087
  0.5 0.5  0.070616  0.066792  0.075982  0.071573
  1.0 1.0  0.056892  0.045061  0.060324  0.047187

BENY 6 年前

可以通过以下方式再次创建列 MultiIndex 使用然后分配回来

dd=df.assign(
        odds_c=lambda x: odds(x[('mu_post', 'c')]),
        odds_t=lambda x: odds(x[('mu_post', 't')]),
)
dd.columns=pd.MultiIndex.from_product([['mu_post','odd'],['c','t']])
dd
Out[506]: 
            mu_post                 odd          
                  c         t         c         t
0 0.0 0.0  0.042824  0.051212  0.044740  0.053977
  0.5 0.5  0.048293  0.058130  0.050743  0.061718
  1.0 1.0  0.047267  0.074043  0.049612  0.079964
1 0.0 0.0  0.058205  0.054106  0.061802  0.057201
  0.5 0.5  0.064153  0.063573  0.068551  0.067889
  1.0 1.0  0.056918  0.059572  0.060353  0.063346
2 0.0 0.0  0.059032  0.052211  0.062735  0.055087
  0.5 0.5  0.070616  0.066792  0.075982  0.071573
  1.0 1.0  0.056892  0.045061  0.060324  0.047187