代码之家 › 专栏 › 技术社区 › DrAl

numpy/pandas:删除顺序重复值(相当于不排序的bash uniq)[重复]

numpy pandas python

DrAl · 技术社区 · 6 年前

这个问题已经有了答案:

对于熊猫系列(或numpy数组),如下所示:

import pandas as pd
myseries = pd.Series([1, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 3, 3, 2, 2, 3, 3, 1])

有没有一种很好的方法可以删除顺序重复项,就像Unix一样 uniq 工具行吗?麻木/熊猫 unique() 熊猫 drop_duplicates 函数删除所有重复项(如unix的 | sort | uniq ,但我不想这样:

>>> print(myseries.unique())
[1 2 3 4]

我想要这个:

>>> print(myseries.my_mystery_function())
[1, 2, 3, 4, 3, 2, 3, 1]

3 回复 | 直到 6 年前

jezrael 6 年前

myseries = myseries[myseries.ne(myseries.shift())].tolist()
print (myseries)
[1, 2, 3, 4, 3, 2, 3, 1]

Divakar

Divakar 6 年前

slicing

In [62]: a = myseries.values

In [63]: a[np.r_[True,a[:-1]!= a[1:]]]
Out[63]: array([1, 2, 3, 4, 3, 2, 3, 1])

U13-Forward 6 年前

!=

print(myseries[myseries!=myseries.shift()].tolist())

[1, 2, 3, 4, 3, 2, 3, 1]

推荐文章

July · 如何定义数字间隔,然后四舍五入

1 年前

Community wiki · 对象名称前的单下划线和双下划线的含义是什么?

1 年前

Brian Johnson · 为什么在Python中列出字典列表会引发TypeError?[已关闭]

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

Ashok Shrestha · 需要追踪特定的颜色线并获取坐标

1 年前

Nicote Ool · 在FastApi和Vue3中获得422

1 年前

NeoExceptCodeBad · 如果我有很多垂直线,我如何找到它们的边缘?

1 年前

Abdulaziz · 如何对集合内的列表进行排序[重复]

1 年前

user2743931 · 带有src目录的Python setup.py

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前