![]() |
1
1
进一步的阅读表明我错了:使用pyScar内核实际上会有星星之火(EMR本身)上运行的代码,而使用Python内核将在JuyTyHub服务器(DOCKER映像)上运行代码。 matplotlib是预先安装在docker映像上的,而不是emr。 在emr主节点上安装matplotlib可以解决pyspark内核中的导入问题。然而,这对使用spark中的数据帧绘制图形没有进一步的帮助(至少对我现在是这样)。 我最终可以按照这个指南得到我想要的结果-将结果传输到“local”(这里“local”是指jupyterhub服务器-docker映像)并使用matplotlib在本地使用 %%本地 魔术: https://github.com/jupyter-incubator/sparkmagic/blob/master/examples/Pyspark%20Kernel.ipynb |
![]() |
ds_user · s3分区上的配置单元查询太慢 6 年前 |
![]() |
WomenWhoCode · 在EMR上运行Spark应用程序速度较慢 6 年前 |
![]() |
ds_user · 在s3中的多个拼花文件上创建配置单元表 7 年前 |
![]() |
Yuriy Bondaruk · 具有多个加密密钥提供程序的EMR 7 年前 |
![]() |
Markus · 如何按需创建EMR集群并执行aws EMR命令? 7 年前 |
![]() |
seiya · AWS EMR上的奇怪火花错误 7 年前 |