1
1
当你对效率有疑问时,正如@Patrick Artner所建议的那样,只需测试一下:
或者,如果你正在使用Jupyter:
但你的问题的答案是:使用chunksize和concat明显比直接使用慢。 只有当你像对待过滤器一样对待数据时,chunksize才有用。 这个想法是为了避免你的电脑内存以任何方式过载。 在这里,再次进行测试:如果你有16Gb的内存,创建一个 str 通过重新感染,直到你的记忆充满的那一刻。一旦你到达那里,你的电脑性能就会急剧下降! 因此,我们处理的块足够小,可以在计算机内存限制内进行处理。。。 在Jupyter下:
在查看内存使用情况时运行以下单元格:
自己看看…:) |
July · 如何定义数字间隔,然后四舍五入 1 年前 |
user026 · 如何根据特定窗口的平均值(行数)创建新列? 1 年前 |
Ashok Shrestha · 需要追踪特定的颜色线并获取坐标 1 年前 |
Nicote Ool · 在FastApi和Vue3中获得422 1 年前 |
Abdulaziz · 如何对集合内的列表进行排序[重复] 1 年前 |
asmgx · 为什么合并数据帧不能按照python中的预期方式工作 1 年前 |