代码之家  ›  专栏  ›  技术社区  ›  Evan Zamir

正在尝试在Amazon EMR上安装pandas for Pyspark

  •  5
  • Evan Zamir  · 技术社区  · 6 年前

    这个问题实际上可以应用于任何Python包。我有一个在Spark作业之前运行的引导脚本,我假设需要在该脚本中安装pandas。我尝试了许多不同的方法,但似乎没有任何效果(pip安装、easy\u安装、yum安装等)。在Spark pandas无法导入时,所有工作都会失败。我正在运行EMR v5.12.1和Python 3.4。

    1 回复  |  直到 6 年前
        1
  •  7
  •   harmands    5 年前
    sudo python3 -m pip install pandas
    

    这是我们在 bootstarp.sh 要安装 pandas