代码之家  ›  专栏  ›  技术社区  ›  t.g.

除了逐字节检查外,还有哪些方法可以确定两个文件内容相同?

  •  1
  • t.g.  · 技术社区  · 15 年前

    逐字节比较肯定有效。但是我想知道是否还有其他的 经过证实的

    What is the fastest way to check if files are identical? . 然而,我的问题不是速度,而是替代方案。

    请告知。谢谢

    4 回复  |  直到 7 年前
        1
  •  3
  •   Ants Aasma    15 年前

    唯一经验证的方法是逐字节比较。这也是最快的方法,如果您一次读取一个字节,您可以将内存使用量减少到2个字节。不过,一次阅读更大的文本块有助于提高性能。

        2
  •  2
  •   Lliane    15 年前

    无论如何,如果文件的长度为n字节,则必须比较n字节,这无法使问题变得更简单。

    杂烩不是一种食物 行之有效的方法 由于冲突,要生成哈希,您还必须读取每个文件上的n个字节。

    如果要多次比较同一文件,可以使用哈希,然后逐字节进行双重检查

        3
  •  1
  •   AakashM    15 年前

    散列不会输出“唯一”值。它不可能这样做,因为有无限多个不同的文件,但只有有限数量的散列值。不需要太多思考就可以意识到这一点 绝对肯定 两个文件是相同的,您必须检查它们的所有字节。

    概率的

        4
  •  0
  •   Nick Dandoulakis    15 年前

    如果要比较多个文件,则 SHA-1 哈希算法是一个很好的选择。