代码之家  ›  专栏  ›  技术社区  ›  anonymous coward

有没有一种简单的方法可以达到“没有父级”的效果,并使用wget从特定的顶级目录中获取文件?

  •  0
  • anonymous coward  · 技术社区  · 5 年前

    使用 wget 版本 1.20.3

    我目前正在使用这样的命令,以保持我的博客的静态“备份”,但仅限于“/blog”下的页面:

    wget --mirror --convert-links --adjust-extension --page-requisites --wait=1 https://example.com/blog

    然而 ,我的一些博客页面引用了存储在顶级“静态”目录中的静态可下载文件(通常是PDF;因此扩展名是已知的和可预测的),例如。,

    https://example.com/static-files/file1.pdf https://example.com/static-files/file2.png

    我希望 --no-parent ,其中 /blog 明确地 喜欢存档所有链接到的文件,这些文件存在于 static-files 目录。

    如果没有,是否有合理的妥协?

    0 回复  |  直到 5 年前
        1
  •  0
  •   anonymous coward    5 年前

    认为 这将做我需要的(它肯定下载了静态文件)。虽然它似乎下载了一些略有不同的文件集,但我不能百分之百确定有什么不同:

    wget --mirror --convert-links --adjust-extension --page-requisites --wait=1  --include-directories="/s,/blog" https://example.com/blog/
    

    blog static-files 博客 包含的内容比以前多。。。但我没看原因。

    这里的主要区别在于,我们不排除父目录 只有

    我欢迎任何人阐述这些差异,并解释为什么这可能是正确的答案,也可能不是正确的答案。