代码之家  ›  专栏  ›  技术社区  ›  LUSAQX

复制数据集中的样本?

  •  0
  • LUSAQX  · 技术社区  · 8 年前

    我使用代码检查我的数据集“df”,并在列“Has_delays”中看到严重的不平衡。我将在Has_delays=1下用重复样本扩展目标数据集35次。i、 e.对Has_delays=1的每次观察采样35次。如何实现这一点?干杯

    如果我想使用分层采样,我如何编码?

    enter image description here

    1 回复  |  直到 8 年前
        1
  •  0
  •   Joe T. Boka    8 年前

    如果我理解正确的话,这可能就是你想要的:

    new = df['Has_Arrears'] == 1
    a = df[new]
    df = df.append([a]*35, ignore_index=True)