![]() |
1
1
在转换为pandas数据帧,然后转换列,然后返回dask时,我发现这是最好的
这将很好地工作,如果df对于内存来说太大,您可以: 1.只计算想要的列,将其转换为两列,然后使用merge将分割结果转换为原始df 2.将df分割成块,然后转换每个块并将其添加到hd5文件中,然后使用dask将整个hd5文件读取到dask数据帧中 |
![]() |
2
1
我发现这种方法很有效,避免了将Dask数据帧转换为Pandas:
哪里
|
![]() |
user1245262 · 筛选Pandas数据帧时出现问题 1 年前 |
|
Foroand · 熊猫数据帧中的词频计数耗时过长 1 年前 |
![]() |
user14696236 · 如何为每个对应的列创建一行[重复] 2 年前 |
![]() |
The Great · 拆分并存储数据帧,但名称基于特定列中的唯一值 2 年前 |
![]() |
nickolakis · 基于R中的列名复制列 2 年前 |
![]() |
A. Handler · 有没有办法将数据帧的列与完整列名向量相匹配? 2 年前 |