代码之家 › 专栏 › 技术社区 › lennyklb

如何在芹菜中异步接收已处理的消息?

celery rabbitmq concurrency asynchronous python

lennyklb · 技术社区 · 6 年前

我正在使用芹菜编写一个数据处理管道,因为这大大加快了速度。

    from celery.result import ResultSet
    from some_celery_app import processing_task # of type @app.task

    def crunch_data():
        results = ResultSet([])
        for document in mongo.find(): #Around 100K - 1M documents
            job = processing_task.delay(document)
            results.add(job)

        return results.get()

    collected_data = crunch_data()
    #Do some stuff with this collected data

我成功地生成了四个启用了并发的worker,当我运行这个脚本时,数据会得到相应的处理,我可以做任何我想做的事情。

我使用RabbitMQ作为消息代理和 rpc 作为后端。

首先,处理所有文件
results.get() 打电话。

我的问题是:有没有一种方法可以同时进行处理和随后的检索?在我的例子中,由于所有文档都是互不依赖的原子实体,因此似乎不需要等待作业被完全处理。

1 回复 | 直到 6 年前

SargeATM 6 年前

您可以在中尝试回调参数 ResultSet.get(callback=cbResult) 然后可以在回调中处理结果。

def cbResult(task_id, value):
  print(value)
results.get(callback=cbResult)

推荐文章

July · 如何定义数字间隔,然后四舍五入

1 年前

Community wiki · 对象名称前的单下划线和双下划线的含义是什么?

1 年前

Brian Johnson · 为什么在Python中列出字典列表会引发TypeError?[已关闭]

1 年前

user026 · 如何根据特定窗口的平均值(行数)创建新列?

1 年前

Ashok Shrestha · 需要追踪特定的颜色线并获取坐标

1 年前

Nicote Ool · 在FastApi和Vue3中获得422

1 年前

NeoExceptCodeBad · 如果我有很多垂直线,我如何找到它们的边缘?

1 年前

Abdulaziz · 如何对集合内的列表进行排序[重复]

1 年前

user2743931 · 带有src目录的Python setup.py

1 年前

asmgx · 为什么合并数据帧不能按照python中的预期方式工作

1 年前