|
1
0
很好,在运行作业之前要记住的一件事是检查内存并根据数据大小分配内存。 假设你有10个内核,50GB内存,最初你有3kb或1MB大小的csv文件,给50GB内存,给1MB文件10个内存是错误的, 在你跳槽之前,你应该小心分配内存和执行器的数量。 在打开sparkshell之前(这里我使用Pyspark和yarn作为资源管理器)
谢谢您。 |
![]() |
Bruno Peixoto · Spark群集CI管道构建失败 1 年前 |
![]() |
mcsilvio · 在foreach中组织联接的最佳方式是什么? 1 年前 |
![]() |
Dhruv · 在sbt控制台上运行Spark 1 年前 |
![]() |
Leonard · Pyspark:JSON到Pyspark数据帧 2 年前 |
![]() |
billie class · 将列中的值重写为列表中的下一个值 2 年前 |