代码之家  ›  专栏  ›  技术社区  ›  AdamW

反向工程自定义数据文件

  •  3
  • AdamW  · 技术社区  · 14 年前

    在我的工作场所,我们有一个遗留文档管理系统,由于各种原因,现在开发人员不支持该系统。我被要求研究如何提取这个系统中包含的文档,以便最终导入到一个新的第三方系统中。

    通过跟踪和进程监视,我确定文档图像(主要是tiff文件)存储在多个1.5gb文件中。这些文件似乎是从一个特定的偏移量读取,然后写入一个tmp文件,然后通过web应用程序提供给客户端,然后删除。

    我想我正在寻找建议,如何检查这些包含tiff图像的大文件,并最终将它们提取并写入单个文件。

    2 回复  |  直到 14 年前
        1
  •  1
  •   John    14 年前

    这些口角是不是被压缩了?如果不是,那么你的工作可能会很简单:将1.5g文件中的tiff缝合在一起。

    你能看到一个特定的1.5G文件(或一系列文件)的输出吗?如果是这样,那么您应该能够拼凑出该tiff的字节,如果它是未压缩的。

    如果字节看起来不在那里,那么尝试一些标准压缩(zip、tar等),看看是否匹配。

        2
  •  0
  •   Chris Thornton    14 年前

    我打开一个文件,寻找所需的偏移量,然后流到一个tiff对象(理想情况下是支持从内存或文件流的对象)。那你就得到了。看看其他的一些位,因为可能有关于文档的元数据对下一个系统有用。