代码之家  ›  专栏  ›  技术社区  ›  Raghav salotra

如何使用pyspark在mysql中保存数据帧

  •  0
  • Raghav salotra  · 技术社区  · 6 年前

    我对apachespark还不熟悉。我有一个用例,我必须在MySQL中保存数据帧数据。我得到了下面的代码来做同样的事情:

    data_frame.write.format('jdbc').options(
        url='URI',
        driver='com.mysql.jdbc.Driver',
        dbtable=table_name,
        user=user_name,
        password='your_password').mode('append').save()
    

        File "/usr/local/Cellar/apache-spark/2.3.1/libexec/python/lib/py4j-0.10.7-src.zip/py4j/protocol.py", line 328, in get_return_value
    py4j.protocol.Py4JJavaError: An error occurred while calling o207.save.
    : java.lang.ClassNotFoundException: com.mysql.jdbc.Driver
    

    我可能错过了一些细节。我怎样才能解决这个问题?

    1 回复  |  直到 4 年前
        1
  •  0
  •   Peter Mortensen icecrime    4 年前

    错误描述清楚地表明它无法定位JDBC驱动程序类。您必须包含com.mysql.jdbc.Driver的JAR文件,使用

    pyspark --jars  <jar-file-location>
    

    看到这个问题了吗- How to add third-party Java JAR files for use in PySpark