代码之家  ›  专栏  ›  技术社区  ›  Ajay Kharade

如何将外部配置文件传递给pyspark(spark2.x)程序?

  •  -1
  • Ajay Kharade  · 技术社区  · 6 年前

    但是,当我试图运行相同的脚本使用Spark提交命令与主纱线和集群部署模式是集群它给我的配置文件不存在的错误,我已经检查纱线日志,并能够看到相同的,下面是运行pyspark作业的命令。

    spark2-submit --master yarn --deploy-mode cluster test.py /home/sys_user/ask/conf/config.ini
    
    1 回复  |  直到 6 年前
        1
  •  1
  •   Ajay Kharade    6 年前

    spark2 sumbmit公司

    e、 g.spark2 submit——主纱线——部署模式集群 pyspark\u脚本.py

        2
  •  0
  •   Jugal Panchal    4 年前

    .config('spark.files', 'config/local/config.ini') \
    

    读入Pypark:

    with open(SparkFiles.get('config.ini')) as config_file:
        print(config_file.read())
    

    这对我很有用。