代码之家  ›  专栏  ›  技术社区  ›  Valentin Jacquemin

PDF文件的结构?

pdf
  •  57
  • Valentin Jacquemin  · 技术社区  · 16 年前

    对于一个小项目,我必须解析PDF文件并从中提取特定的部分(一个简单的字符链)。我想使用python来完成这项工作,并且我发现了几个库能够以某种方式完成我想要的工作。

    但是现在经过一些研究,我想知道一个PDF文件的真正结构是什么,有人知道在网上的任何地方是否有规范或解释吗?我在Adobe上找到了一个链接,但它似乎是一个死链接:(