我有一个大文件,我使用pandas chunksize将其拆分为大约500个块:
index=0
for df_ia in pd.read_csv("/path/to/file/file.TXT", chunksize=100000,iterator=True, low_memory=False):
index += 1
if index < 500:
continue
elif index > 560:
break
问题是,正如代码所示,如果我想去第500块做一些逻辑,我需要从第一块开始,逐块,直到第500块,这大约需要200秒,然后我可以做一些真正的逻辑。
我的问题是,有没有什么方法可以分割块,直接跳到块500来做逻辑,比如:
for df_ia in pd.read_csv("/path/to/file/file.TXT", chunksize=100000,iterator=True, low_memory=False):
if chunk_index ==500:
do logic
或者类似于:
for df_ia in pd.read_csv("/path/to/file/file.TXT", chunksize=100000,iterator=True, low_memory=False , chunk[500:]):
注意,我使用了切片块[500:]