代码之家  ›  专栏  ›  技术社区  ›  user3495042

将多个文件夹和子文件夹中的多个excel文件合并到一个pandas数据框中

  •  0
  • user3495042  · 技术社区  · 7 年前

    我的主文件夹叫做“Data”。在里面,我有20个文件夹,标签从1到20。在这20个子文件夹中,我有另外1到5个子文件夹,其中一个叫做“test\u results”(我感兴趣的那个)。在test\u result文件夹中,我有几个文件,从。jpeg。csv。xlxs。我需要和他一起工作。xlxs文件。如何检索。xlxs文件仅位于父文件夹“Data”中,并将它们连接到一个数据帧中,以便我可以进行分析?

    当所有文件都位于一个文件夹中时,我知道如何操作,但它们位于子文件夹中,并且与其他类型的文件混合在一起,这增加了复杂性,我无法理解。

    1 回复  |  直到 7 年前
        1
  •  0
  •   MaxU - stand with Ukraine    7 年前

    使用 pathlib 单元

    演示:

    from pathlib import Path
    
    p = Path(r'/path/to/Data')
    
    df = pd.concat([pd.read_excel(f) for f in p.glob('**/test_results/*.xlsx')],
                   ignore_index=True)