代码之家  ›  专栏  ›  技术社区  ›  not2qubit

如何提取被刮图像的文件修改时间?

  •  3
  • not2qubit  · 技术社区  · 6 年前

    我试着从一个包含零件图片的零件网站上搜集一些数据。但是,没有网址或图片上传或创建日期,所以我不得不使用近似的图像文件 修改日期 来获取这个信息。使用 卷曲 ,这是一项简单的任务:

    curl -sI https://path.to.com/blahblah_123/item_picture.jpg |grep "last-modified"
    

    不过,我认为在最短的时间内完成这项工作会更方便 粘糊糊的 蜘蛛。但我完全不知道scrapy是否支持这一点,因为我在文档中找不到它。

    有没有办法得到

    1 回复  |  直到 6 年前
        1
  •  3
  •   tdelev    6 年前

    Scrapy ,的 response 有一个 headers dict字段。

    所以你可以访问 last-modified 具有 response.headers.get('Last-Modified')