代码之家  ›  专栏  ›  技术社区  ›  zerohedge

pandas:按特定列的值计数保留数据帧的前x%

  •  0
  • zerohedge  · 技术社区  · 6 年前
    autos["brand"].value_counts(normalize=True)
    

    输出如下:

    volkswagen       0.211
    bmw              0.126
    mercedes_benz    0.109
    audi             0.099
    opel             0.090
    ford             0.059
    renault          0.038
    peugeot          0.028
    fiat             0.021
    skoda            0.019
    seat             0.018
    smart            0.017
    toyota           0.015
    mazda            0.015
    citroen          0.014
    nissan           0.014
    hyundai          0.011
    mini             0.011
    volvo            0.009
    kia              0.008
    sonstige_autos   0.007
    honda            0.007
    mitsubishi       0.007
    porsche          0.007
    chevrolet        0.006
    alfa_romeo       0.006
    suzuki           0.006
    Name: brand, dtype: float64
    

    我当然可以创建一个布尔掩码:

    brands_bool = brand_percentages > 0.03
    

    然后应用到 df ,但我想知道有没有更快/更短的方法。

    0 回复  |  直到 6 年前