代码之家  ›  专栏  ›  技术社区  ›  Jaffer Wilson Dilip kumar

将计数添加到新列pandas python 3

  •  1
  • Jaffer Wilson Dilip kumar  · 技术社区  · 6 年前

    我正在尝试删除重复的行,并使用 pandas . 以下陈述是我所尝试的:

    createModel['count'] = createModel.groupby(createModel.columns.tolist(),as_index=False).size()
    createModel.to_csv(r"test1.csv",index=False,header =True,sep="\t",encoding="utf-16")
    createModel.head(10)
    

    但我有个错误: TypeError: incompatible index of inserted column with frame index

    我知道这是因为我已经补充了 count . 如果我删除它,然后尝试保存文件,我只能保护 计数 .

    请告诉我如何保存完整的数据帧而不重复,并将列添加为 计数 这意味着行出现的次数的计数。

    1 回复  |  直到 6 年前
        1
  •  2
  •   jezrael    6 年前

    transform groupby []

    cols = createModel.columns.tolist()
    #another solution, thanks @jpp
    #cols = list(createModel)
    createModel['count'] = createModel.groupby(cols)[cols[0]].transform('size')
    

    reset_index

    createModel = createModel.groupby(cols).size().reset_index(name='count')