|   |      1 
                                  3
                             
   尝试使用
    | 
|   |      2 
                                  1
                             Spark只按需实现RDD,大多数操作需要读取DF的所有分区,例如us count(),但take()和first()等操作不需要所有分区。 在您的情况下,它需要一个分区,因此只有一个分区被物化和缓存。然后,在执行count()时,所有分区都需要具体化并缓存到可用内存允许的范围内。 | 
|   | tincho87 · 避免Javascript/Css缓存 7 年前 | 
|   | Zac · 如何强制客户端重新下载我的网站? 7 年前 | 
|   | Kumar · bitbake清理使用只读NFS SSTATE缓存失败 7 年前 | 
|   | Chris Williams · 休眠/JPA缓存查找值 7 年前 | 
|   | Nymeria · 仅绑定到当前事务的Spring缓存 7 年前 |