代码之家 › 专栏 › 技术社区 › t.g.

除了逐字节检查外,还有哪些方法可以确定两个文件内容相同?

compare file algorithm

t.g. · 技术社区 · 15 年前

逐字节比较肯定有效。但是我想知道是否还有其他的 经过证实的

请告知。谢谢

4 回复 | 直到 7 年前

Ants Aasma 15 年前

唯一经验证的方法是逐字节比较。这也是最快的方法,如果您一次读取一个字节,您可以将内存使用量减少到2个字节。不过,一次阅读更大的文本块有助于提高性能。

Lliane 15 年前

无论如何,如果文件的长度为n字节,则必须比较n字节,这无法使问题变得更简单。

杂烩不是一种食物 行之有效的方法 由于冲突,要生成哈希,您还必须读取每个文件上的n个字节。

如果要多次比较同一文件,可以使用哈希,然后逐字节进行双重检查

AakashM 15 年前

散列不会输出“唯一”值。它不可能这样做,因为有无限多个不同的文件,但只有有限数量的散列值。不需要太多思考就可以意识到这一点 绝对肯定 两个文件是相同的,您必须检查它们的所有字节。

概率的

Nick Dandoulakis 15 年前

如果要比较多个文件,则 SHA-1 哈希算法是一个很好的选择。

推荐文章

SkyWalker · 在JavaScript中,合并日期-时间序列的有效算法是什么?

1 年前

root · 计数算法

1 年前

André Silveira · 使用循环将数组的每个槽递增1。数组的大小是传递给函数的参数

2 年前

danial · 如何在多个字符串的每个位置找到最频繁的字符

2 年前

Manny · 如何比较Perl中的字符串?

2 年前

Suhail Gupta · 在排序阵列中查找目标范围的时间复杂度-此解在最坏情况下是否为O(N)?

2 年前

Diret · 获取范围内每个数字的子倍数的算法

2 年前

Saif · 排序时python如何决定何时调用比较器?

2 年前

TryingToLearn · 我如何为通用遥控器构造一个类,该遥控器向连接到它的各种设备发送开/关命令?

2 年前

Sneha Sharma · 滑动窗口-在我的代码中找不到错误(非常基本的算法)

2 年前