![]() |
1
3
尝试使用
|
![]() |
2
1
Spark只按需实现RDD,大多数操作需要读取DF的所有分区,例如us count(),但take()和first()等操作不需要所有分区。 在您的情况下,它需要一个分区,因此只有一个分区被物化和缓存。然后,在执行count()时,所有分区都需要具体化并缓存到可用内存允许的范围内。 |
![]() |
maximodesousadias · 如何根据条件删除日期后的记录 11 月前 |
|
user23358051 · 火花顺序优化规则 1 年前 |
![]() |
nfsp412 · 当我使用spark-sql时,将出现此错误 1 年前 |