代码之家  ›  专栏  ›  技术社区  ›  Brendan

PySpark执行器库何时会与驱动程序不同?

  •  0
  • Brendan  · 技术社区  · 4 年前

    我一直在跟踪 this guide (为Medium帖子道歉),它展示了如何为Spark执行器和驱动程序分别打包python env和库。什么时候你会期望每个库都需要不同的库?我认为一个简单但具体的例子会有所帮助。

    0 回复  |  直到 4 年前
        1
  •  2
  •   Aditya Vikram Singh    4 年前

    想象一下,一旦火花作业完成,您需要向用户发送一封电子邮件作为通知,现在发送电子邮件的特定功能将始终在驱动程序上执行,所以 smtplib 并且相关库只需要在驱动程序上可用,因为执行者不会发送电子邮件。