1
11
我发现过滤Dask数据帧(例如按日期)通常会导致空分区。如果您在使用带有空分区的数据帧时遇到问题,根据MRocklin的指导,这里有一个函数可以剔除它们:
|
2
2
对于处理行李(非数据帧)的任何人,此功能将实现以下功能:
|
3
1
没有简单的API可以做到这一点。你可以打电话
如果您将来发现一个函数不能很好地与空分区配合使用,如果您愿意提出问题,我们将不胜感激。 https://github.com/dask/dask/issues/new |
4
1
下面是我删除空分区的尝试:
FWIW,@tpegbert的答案似乎在获取过滤数据帧所需的任务数量方面更有效。 |
Bo Qiang · 使用dask对非常大的数据进行排序? 7 年前 |
Minsky · 对于具有Dask阵列和/或h5py的环路 7 年前 |
rth · Dask中具有可重用自定义图的机会缓存 7 年前 |
morganics · 删除Dask中的空分区 7 年前 |
Pablo · 使用dask。纸袋从\u序列计算核密度估计 7 年前 |
Julian C · dask按聚合正确使用 7 年前 |
vva · 如何使用Dask在yarn上运行并行python作业? 7 年前 |