代码之家 › 专栏 › 技术社区 › OpticalMagician

移除N个随机对象的最快方法

random performance python-2.7

OpticalMagician · 技术社区 · 7 年前

我的问题如下,我目前正在处理生成的长度为m的列表。然而,该列表应该是以n作为最终长度参数的算法的结果。m总是比n大得多。目前我正在运行一个while循环,其中m是len(list)的结果。

from numpy import random as rnd
m = 400000
n = 3000
list = range(0, m)
while len(list) > n:
    rmi = rnd.randint(0, len(list))
    del list[rmi]
    print('%s/%s' %(len(list), n))

这种方法当然有效,但运行时间非常长。有没有一种更高效、更省时的方法从我的列表中删除m-n个随机条目?删除的条目必须是随机的,否则生成的列表将不再代表它应该是什么。

稍后在我的代码中,我有两个大小为n的数组,需要将其缩短为大小b,这里需要注意的是,两个列表都需要随机删除元素,但删除的元素也必须共享相同的索引。即:

from numpy import random as rnd
n = 3000
b = 500
list1 = range(0, n)
list2 = rnd.sample(xrange(10000), n)
while len(list1) > b:
    rmi = rnd.randint(0, len(list1))
    del list1[rmi]
    del list2[rmi]
    print('%s/%s' %(len(list1), b)

1 回复 | 直到 7 年前

alvis 7 年前

试试numpy.random。选择,它会创建列表的随机样本:

https://docs.scipy.org/doc/numpy-1.10.1/reference/generated/numpy.random.choice.html

import numpy as np
...
np.random.choice(range(0,m), size=n)

推荐文章

S. Jacson · 任意两台发电机的速度差(内置功能)

2 年前

Luna · (编辑)我用Swift和C lang(查找素数)编写了相同的代码,但C lang比Swift快得多

2 年前

Sadeq Dousti · 相当于“嵌套删除”的执行性能SQL查询

2 年前

Prince · 复制大型文件需要更多时间

2 年前

DCoder · 试图理解为什么我的C++程序在运行了很长时间后速度变慢

2 年前

Sagar · 为什么在循环之外声明变量会更快?

2 年前

mpx · 在Python中查找整数可以与Numpy或Pandas一起驻留的最近边界值对

2 年前

seco · 如何在不挂起页面的情况下加载JS

2 年前

Dimidrie · AsyncProfiler-无法在JMH benchmark runner中加载探查器

2 年前

Mangi · 试着用while循环按字母顺序比较两个单词,看看猜测是在单词之前还是之后

2 年前