代码之家  ›  专栏  ›  技术社区  ›  Omer

Apache气流分布式处理

  •  0
  • Omer  · 技术社区  · 7 年前

    我对Apache Airflow的架构感到困惑。

    在oozie中执行hql或sqoop语句时,oozie将请求定向到数据节点。

    我想在Apache Airflow中实现同样的效果。我想执行shell脚本、hql或sqoop命令,并且我想确保我的命令是由数据节点分布式执行的。 气流有不同的执行器类型。为了在不同的数据节点中同时运行命令,我应该做什么?

    2 回复  |  直到 7 年前
        1
  •  3
  •   x97Core    6 年前

    似乎您希望在分布式工作者上执行任务。在这种情况下,请考虑使用 CeleryExecutor .

    工人。为此,您需要设置芹菜后端 (RabbitMQ,Redis,)并改变气流。cfg指向执行者 参数,并提供相关芹菜设置。

    https://airflow.apache.org/configuration.html#scaling-out-with-celery

        2
  •  0
  •   Amit Kumar    6 年前