代码之家 › 专栏 › 技术社区 › blue-sky

计算“熊猫”列中每个值出现的次数

pandas python

blue-sky · 技术社区 · 6 年前

import pandas as pd 

test_values = []

test_values.append(np.array([1,0,1]))
test_values.append(np.array([1,0,1]))
test_values.append(np.array([0,1,1]))

test_values

df = pd.DataFrame(test_values)

呈现此数据帧会产生:

我正试图计算每个值在列中出现的次数,因此对于上面的数据帧,应该生成以下内容:

1 occurs 2, 0 occurs 0. 
0 occurs 2, 1 occurs 1. 
1 occurs 3, 0 occurs 0.

使用.values():

for i in range(0 , df.shape[1]) : 
    print(df.iloc[:,i].value_counts().values)

生产:

[2 1]
[2 1]
[3]

标签已从每列中删除。如何访问每个计数的相关标签?因此可以产生:

1发生2,0发生0。
0发生在2,1发生在1。
1发生3,0发生0。

3 回复 | 直到 6 年前

cors 6 年前

简单解决方案:

df.apply(pd.Series.value_counts)

jezrael 6 年前

如果只有预期 0 和 1 值添加 reindex 对于添加缺少的值-按预期值列表重新索引:

for i in range(0 , df.shape[1]) : 
    a = df.iloc[:,i].value_counts().reindex([0,1], fill_value=0)
    print (', '.join('{} occurs {}.'.format(k, v) for k, v in a.items()))

0 occurs 1., 1 occurs 2.
0 occurs 2., 1 occurs 1.
0 occurs 0., 1 occurs 3.

jpp 6 年前

您可以通过 pd.Series.items :

for i in range(0 , df.shape[1]):
    counts = df.iloc[:,i].value_counts()
    gen = (f'{key} occurs {value} times' for key, value in counts.items())
    print(*gen, sep=', ')

不清楚您希望如何推断零计数,所以我没有假设这是一个要求。结果给出:

1 occurs 2 times, 0 occurs 1 times
0 occurs 2 times, 1 occurs 1 times
1 occurs 3 times

推荐文章

July · 如何定义数字间隔,然后四舍五入

1 年前

Community wiki · 对象名称前的单下划线和双下划线的含义是什么?

1 年前

Brian Johnson · 为什么在Python中列出字典列表会引发TypeError?[已关闭]

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

Ashok Shrestha · 需要追踪特定的颜色线并获取坐标

1 年前

Nicote Ool · 在FastApi和Vue3中获得422

1 年前

NeoExceptCodeBad · 如果我有很多垂直线,我如何找到它们的边缘?

1 年前

Abdulaziz · 如何对集合内的列表进行排序[重复]

1 年前

user2743931 · 带有src目录的Python setup.py

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前