代码之家  ›  专栏  ›  技术社区  ›  tylerl

用于Unix的随机访问存档

  •  3
  • tylerl  · 技术社区  · 14 年前

    我正在寻找一种好的格式来归档旧Linux计算机的整个文件系统。

    葛兰素
    gz格式非常适合归档具有Unix样式属性的文件,但是由于压缩应用于整个归档,因此设计排除了随机访问。相反,如果您想在归档文件的末尾访问一个文件,您必须从一开始就解压缩整个文件(可能是几百GB),直到找到您要查找的条目为止。

    拉链
    相反,zip格式的一个卖点是它存储了存档的索引:文件名单独存储,指向存档中的位置的指针用于查找数据。如果我想在末尾提取一个文件,我将按名称查找该文件的位置,查找该位置,然后提取数据。但是,它不存储文件属性,如所有权、权限、符号链接等。

    其他选择?
    我试过用 squashfs 但它并不是为这个目的而设计的。版本之间的文件格式不一致,构建存档需要大量的时间和空间。

    还有什么其他选择更适合这个目的?

    2 回复  |  直到 14 年前
        1
  •  1
  •   Lukasz Stelmach    14 年前

    你可以检查 duplicty . 它允许您进行压缩和加密备份,并允许随机访问文件。您可以在这里找到有关这些项目的更多信息: http://duplicity.nongnu.org/new_format.html .

    如果您想使用它,还可以检查脚本 duply . 是外壳前端 重复性 . 更多信息: http://sourceforge.net/projects/ftplicity/

        2
  •  1
  •   DVK    14 年前

    拉链(您可以使用 http://www.info-zip.org/ )存储文件属性-请参见 Wiki

    每个条目都由本地 包含文件信息的标题 例如注释、文件大小和 文件名,后跟可选的 “额外”数据字段,然后 可能压缩,可能 加密文件数据。“额外”数据 字段是 zip格式的可扩展性。 “额外的”字段被用来 支持zip64格式, WinZip兼容的AES加密,文件 属性和更高分辨率的NTFS 或Unix文件时间戳。其他 可以通过 “额外”字段。需要Zip工具 按规范忽略多余的 他们无法识别的字段。