1
19
通常,您应该始终深入日志以获取真正的异常(至少在Spark 1.3.1中)。
tl;博士
更多信息 通过阅读你的问题,你提到你得到了洗牌没有找到例外。
万一
Yarn杀死我的执行者最常见的原因是内存使用超出了预期。
为了避免增加
|
2
0
这是我的假设:您的集群上必须有有限的执行者,并且作业可能在共享环境中运行。
正如您所说,您的文件大小很小,您可以设置较少的执行器数量,增加执行器核心,并设置
使用上述属性,我确信您可以避免任何执行器内存不足的问题,而不会影响性能。 |
Pasq · 将远程目录发布到远程Repo Github工作流 1 年前 |
Ondrej · GCP Dataproc-配置纱线展计划程序 6 年前 |
jk1 · 纱线是否计算过执行器数量? 6 年前 |
Lejla · 在dataproc上找不到有效的SPARK\u主页 6 年前 |