代码之家 › 专栏 › 技术社区 › Davi A. Sampaio

使用pytube的多线程没有性能奖励

pytube concurrent.futures python-multithreading multithreading python

Davi A. Sampaio · 技术社区 · 2 年前

我正在使用pytube库来检索YouTube视频列表的流信息。我已经使用一个简单的循环以及用于多线程的concurrent.futures和多处理库实现了流的检索。然而,我并没有看到我所期望的性能提升,所有方法都需要大约130秒才能运行。

我使用的代码如下:

def _get_streams(self, yt: pytube.YouTube):
    return yt.streams

@print_execution_time
def get_streams_futures(self):
    with concurrent.futures.ThreadPoolExecutor() as executor:
        future_results = [executor.submit(self._get_streams, yt) for yt in self._create_yt_obj()]
        result = [future.result() for future in concurrent.futures.as_completed(future_results)]
    return result


@print_execution_time
def get_streams_linear(self):
    return [yt.streams for yt in self._create_yt_obj()]


@print_execution_time
def get_streams_multiprocessing(self):
    with multiprocessing.Pool() as pool:
        result = pool.map(self._get_streams, self._create_yt_obj())

    return result

@print_execution_time 是一个简单的装饰器,用于计算函数的运行时间

我期望多线程方法比循环方法运行得更快,但事实并非如此。有人能解释为什么会发生这种情况,以及可以做些什么来实现所需的性能提升吗?

没有出现错误

0 回复 | 直到 2 年前

推荐文章

Zdanovskiy Mihail · Numba使用parallel=True标志集使Python崩溃

1 年前

Ma Joonyoung · 粗粒度和细粒度链表的时间比较

1 年前

Community wiki · SqlConnections,Parallel.For,一个旧的C#应用程序,初始化SqlConnections时随机挂起

1 年前

user1700890 · 了解交互式代理Python API中的线程

2 年前

AntonBoarf · 为什么要将实例变量指定给局部变量?

2 年前

rhymes · 如何让线程操作相同的java列表

2 年前

Ben · 错误:缺少类型说明符-假定为int。注意C++不支持默认初始化

2 年前

SRK7Kyros · 在Python中启动线程时是否使用整个处理器线程?

2 年前

MatiiFine · 在c++[duplicate]中的主源文件外使用std::thread

2 年前

Youssof. K. · 线程1:vector insert上的EXC_BAD_访问(代码=1,地址=0x0)

2 年前